El ejercicio consiste en determinar alos estadísticoa básicos de tipo descriptivos
Los estadísticos son la media, el mínimo, el máximo, los cuartiles, el rango, la varianza, la desviación, entre otros.
library(readr)
## Warning: package 'readr' was built under R version 4.0.3
datos.personas <- read.csv("https://raw.githubusercontent.com/rpizarrog/FundamentosMachineLearning/master/datos/personas.2.csv", encoding = "iso-8859-1", stringsAsFactors = TRUE)
datos.personas
## id nombres edades generos feliz estaturas pesos zonas
## 1 1 Juan 24 M TRUE 1.65 80 CENTRO
## 2 2 Pedro 34 M FALSE 1.70 70 SUR
## 3 3 Luis 51 M TRUE 1.54 75 SUR
## 4 4 Aracely 32 F TRUE 1.72 60 CENTRO
## 5 5 Rubén 45 M FALSE 1.70 65 ORIENTE
## 6 6 Linda 30 F TRUE 1.80 70 PONIENTE
## 7 7 Brenda 43 F FALSE 1.90 86 CENTRO
## 8 8 Lucy 54 F TRUE 1.75 90 SUR
## 9 9 Liliana 54 F FALSE 1.72 50 PONIENTE
## 10 10 Aracely 23 F TRUE 1.65 76 CENTRO
## 11 11 Luis 34 M FALSE 1.78 78 SUR
## 12 12 Gabriel 23 M TRUE 1.90 89 NORTE
## 13 13 Jimena 45 F FALSE 1.65 65 SUR
La función summary() visualiza los estadísticos básicos y describe de manera general los datos
summary(datos.personas)
## id nombres edades generos feliz
## Min. : 1 Aracely:2 Min. :23.00 F:7 Mode :logical
## 1st Qu.: 4 Luis :2 1st Qu.:30.00 M:6 FALSE:6
## Median : 7 Brenda :1 Median :34.00 TRUE :7
## Mean : 7 Gabriel:1 Mean :37.85
## 3rd Qu.:10 Jimena :1 3rd Qu.:45.00
## Max. :13 Juan :1 Max. :54.00
## (Other):5
## estaturas pesos zonas
## Min. :1.540 Min. :50.00 CENTRO :4
## 1st Qu.:1.650 1st Qu.:65.00 NORTE :1
## Median :1.720 Median :75.00 ORIENTE :1
## Mean :1.728 Mean :73.38 PONIENTE:2
## 3rd Qu.:1.780 3rd Qu.:80.00 SUR :5
## Max. :1.900 Max. :90.00
##
media.edad <- mean(datos.personas$edades)
media.estatura <- mean(datos.personas$estaturas)
media.peso <- mean(datos.personas$pesos)
media.edad
## [1] 37.84615
media.estatura
## [1] 1.727692
media.peso
## [1] 73.38462
max(datos.personas$edades)
## [1] 54
min(datos.personas$edades)
## [1] 23
range(datos.personas$edades)
## [1] 23 54
varianza.edad <- var(datos.personas$edades)
desviacion.edad <- sd(datos.personas$edades)
varianza.edad
## [1] 131.8077
desviacion.edad
## [1] 11.48075