Objetivo:
- Realizar cálculos para determinar medidas de localización y tendencia central como CUARTILES Y PERCENTILES con un conjunto de datos de personas.
Descripcion:
- Con un conjunto de datos de personas y con variables de interés como la edad, peso y estatura, determinar medidas de localización y tendencia central, se pide mostrar los datos, identificar las medidas visualizar gráficamente e interpretar las medidas
1. Cargar librerÃas
library (readr)
library (ggplot2)
2. Construir los datos. 100 observaciones
- Edades en donde la media sea 45 años y desviación stándard igual a 10 años
- Pesos en donde la media sea 75 kgs y desviación standard = 15 kgs
- Estaturas en donde la media sea 1.70 y desviación estándard igual a 0.10
set.seed(1408)
n <- 100
media.edad <- 45; ds.edad <- 10
media.peso <- 75; ds.peso <- 15
media.estatura <- 1.70; ds.estatura <- 0.10
- Contruir el conjunto de datos personas
edad <- round(rnorm(n = n, mean = media.edad, sd = ds.edad),0)
peso <- round(rnorm(n = n, mean = media.peso, sd = ds.peso),2)
estatura <- round(rnorm(n = n, mean = media.estatura, sd = ds.estatura),2)
personas <- data.frame(edad, peso, estatura)
head(personas); tail(personas)
## edad peso estatura
## 1 47 83.02 1.89
## 2 58 77.05 1.70
## 3 29 108.38 1.71
## 4 42 82.81 1.72
## 5 61 87.02 1.80
## 6 31 55.38 1.76
## edad peso estatura
## 95 42 79.45 1.79
## 96 59 49.32 1.69
## 97 27 83.46 1.65
## 98 32 75.31 1.71
## 99 44 94.22 1.73
## 100 48 61.25 1.68
3. Cuartiles al 25%, 50% y 75%
cuartiles1 <- quantile(personas$edad, probs = c(0.25, 0.50, 0.75), type = 6)
cuartiles1[1]
## 25%
## 38
cuartiles1[2]
## 50%
## 44.5
cuartiles1[3]
## 75%
## 50
cuartiles2 <- quantile(personas$estatura, probs = c(0.25, 0.50, 0.75), type = 6)
cuartiles2[1]
## 25%
## 1.6225
cuartiles2[2]
## 50%
## 1.7
cuartiles2[3]
## 75%
## 1.77
cuartiles3 <- quantile(personas$peso, probs = c(0.25, 0.50, 0.75), type = 6)
cuartiles3[1]
## 25%
## 60.6975
cuartiles3[2]
## 50%
## 71.57
cuartiles3[3]
## 75%
## 84.38
4. Determinar rango intercuartilico
RI <- cuartiles1[3] - cuartiles1[1]
RI
## 75%
## 12
RI <- cuartiles2[3] - cuartiles2[1]
RI
## 75%
## 0.1475
RI <- cuartiles3[3] - cuartiles3[1]
RI
## 75%
## 23.6825
5. Percentiles
percentil <- quantile(personas$edad, probs = c(0.10, 0.30, 0.50, 0.70, 0.90), type = 7)
percentil[1]
## 10%
## 31
percentil[2]
## 30%
## 40.4
percentil[3]
## 50%
## 44.5
percentil[4]
## 70%
## 48
percentil[5]
## 90%
## 56
percentil <- quantile(personas$estatura, probs = c(0.10, 0.30, 0.50, 0.70, 0.90), type = 7)
percentil[1]
## 10%
## 1.55
percentil[2]
## 30%
## 1.65
percentil[3]
## 50%
## 1.7
percentil[4]
## 70%
## 1.753
percentil[5]
## 90%
## 1.811
percentil <- quantile(personas$peso, probs = c(0.10, 0.30, 0.50, 0.70, 0.90), type = 7)
percentil[1]
## 10%
## 53.339
percentil[2]
## 30%
## 64.167
percentil[3]
## 50%
## 71.57
percentil[4]
## 70%
## 82.901
percentil[5]
## 90%
## 94.345
6. Visualizar datos
ggplot(data = personas, aes(edad, colour = 'edad')) +
geom_histogram(position = "stack", bins = 20)

ggplot(data = personas, aes(y=edad)) +
geom_boxplot() +
labs(title = "Cuartiles de edad" ,subtitle = paste("Q1 al 25% = ",round(quantile(personas$edad, 0.25),2), "Q2 al 50% = ",round(quantile(personas$edad), 2),"Q3 al 75% = ",round(quantile(personas$edad),2)))

boxplot(personas$edad)

ggplot(data = personas, aes(estatura, colour = 'estatura')) +
geom_histogram(position = "stack", bins = 20)

ggplot(data = personas, aes(y=estatura)) +
geom_boxplot() +
labs(title = "Cuartiles de estatura" ,subtitle = paste("Q1 al 25% = ",round(quantile(personas$estatura, 0.25),2), "Q2 al 50% = ",round(quantile(personas$estatura), 2),"Q3 al 75% = ",round(quantile(personas$estatura),2)))

boxplot(personas$estatura)

ggplot(data = personas, aes(peso, colour = 'peso')) +
geom_histogram(position = "stack", bins = 20)

ggplot(data = personas, aes(y=peso)) +
geom_boxplot() +
labs(title = "Cuartiles de peso" ,subtitle = paste("Q1 al 25% = ",round(quantile(personas$peso, 0.25),2), "Q2 al 50% = ",round(quantile(personas$peso), 2),"Q3 al 75% = ",round(quantile(personas$peso),2)))

boxplot(personas$peso)

7. Interpretar y comunicar datos.
Los cuartiles son elementos que dividen un conjunto de datos ordenados en cuatro partes por ello el nombre cuartil. En cambio para el percentil primero se ordenan los datos de menor a mayor y el percentil representa un valor por debajo del cual se encuentra un porcentaje dado de observaciones en un grupo. Para visualizar y entender mejor los datos se puede utilizar se puede utilizar un diagrama de caja de la librerÃa ggplot2 para tener una idea mas clara de lo que representan estos datos, o bien un histograma para visualizar las frecuencias de un conjunto de datos.