Objetivo:
Descripcion:

1. Cargar librerías

library (readr)
library (ggplot2)

2. Construir los datos. 100 observaciones

set.seed(1408)
n <-  100
media.edad <- 45; ds.edad <- 10
media.peso <- 75; ds.peso <- 15
media.estatura <- 1.70; ds.estatura <- 0.10
edad <- round(rnorm(n = n, mean = media.edad, sd = ds.edad),0)
peso <- round(rnorm(n = n, mean = media.peso, sd = ds.peso),2)
estatura <- round(rnorm(n = n, mean = media.estatura, sd = ds.estatura),2)

personas <- data.frame(edad, peso, estatura)
head(personas); tail(personas)
##   edad   peso estatura
## 1   47  83.02     1.89
## 2   58  77.05     1.70
## 3   29 108.38     1.71
## 4   42  82.81     1.72
## 5   61  87.02     1.80
## 6   31  55.38     1.76
##     edad  peso estatura
## 95    42 79.45     1.79
## 96    59 49.32     1.69
## 97    27 83.46     1.65
## 98    32 75.31     1.71
## 99    44 94.22     1.73
## 100   48 61.25     1.68

3. Cuartiles al 25%, 50% y 75%

cuartiles1 <- quantile(personas$edad, probs = c(0.25, 0.50, 0.75), type = 6)
cuartiles1[1]
## 25% 
##  38
cuartiles1[2]
##  50% 
## 44.5
cuartiles1[3]
## 75% 
##  50
cuartiles2 <- quantile(personas$estatura, probs = c(0.25, 0.50, 0.75), type = 6)
cuartiles2[1]
##    25% 
## 1.6225
cuartiles2[2]
## 50% 
## 1.7
cuartiles2[3]
##  75% 
## 1.77
cuartiles3 <- quantile(personas$peso, probs = c(0.25, 0.50, 0.75), type = 6)
cuartiles3[1]
##     25% 
## 60.6975
cuartiles3[2]
##   50% 
## 71.57
cuartiles3[3]
##   75% 
## 84.38

4. Determinar rango intercuartilico

RI <- cuartiles1[3] - cuartiles1[1]
RI
## 75% 
##  12
RI <- cuartiles2[3] - cuartiles2[1]
RI
##    75% 
## 0.1475
RI <- cuartiles3[3] - cuartiles3[1]
RI
##     75% 
## 23.6825

5. Percentiles

percentil <- quantile(personas$edad, probs = c(0.10, 0.30, 0.50, 0.70, 0.90), type = 7)
percentil[1]
## 10% 
##  31
percentil[2]
##  30% 
## 40.4
percentil[3]
##  50% 
## 44.5
percentil[4]
## 70% 
##  48
percentil[5]
## 90% 
##  56
percentil <- quantile(personas$estatura, probs = c(0.10, 0.30, 0.50, 0.70, 0.90), type = 7)
percentil[1]
##  10% 
## 1.55
percentil[2]
##  30% 
## 1.65
percentil[3]
## 50% 
## 1.7
percentil[4]
##   70% 
## 1.753
percentil[5]
##   90% 
## 1.811
percentil <- quantile(personas$peso, probs = c(0.10, 0.30, 0.50, 0.70, 0.90), type = 7)
percentil[1]
##    10% 
## 53.339
percentil[2]
##    30% 
## 64.167
percentil[3]
##   50% 
## 71.57
percentil[4]
##    70% 
## 82.901
percentil[5]
##    90% 
## 94.345

6. Visualizar datos

ggplot(data = personas, aes(edad, colour = 'edad')) +
    geom_histogram(position = "stack", bins = 20)

ggplot(data = personas, aes(y=edad)) +
         geom_boxplot() +
  labs(title = "Cuartiles de edad" ,subtitle =  paste("Q1 al 25% = ",round(quantile(personas$edad, 0.25),2), "Q2 al 50% = ",round(quantile(personas$edad), 2),"Q3 al 75% = ",round(quantile(personas$edad),2)))

boxplot(personas$edad)

ggplot(data = personas, aes(estatura, colour = 'estatura')) +
    geom_histogram(position = "stack", bins = 20)

ggplot(data = personas, aes(y=estatura)) +
         geom_boxplot() +
  labs(title = "Cuartiles de estatura" ,subtitle =  paste("Q1 al 25% = ",round(quantile(personas$estatura, 0.25),2), "Q2 al 50% = ",round(quantile(personas$estatura), 2),"Q3 al 75% = ",round(quantile(personas$estatura),2)))

boxplot(personas$estatura)

ggplot(data = personas, aes(peso, colour = 'peso')) +
    geom_histogram(position = "stack", bins = 20)

ggplot(data = personas, aes(y=peso)) +
         geom_boxplot() +
  labs(title = "Cuartiles de peso" ,subtitle =  paste("Q1 al 25% = ",round(quantile(personas$peso, 0.25),2), "Q2 al 50% = ",round(quantile(personas$peso), 2),"Q3 al 75% = ",round(quantile(personas$peso),2)))

boxplot(personas$peso)

7. Interpretar y comunicar datos.

Los cuartiles son elementos que dividen un conjunto de datos ordenados en cuatro partes por ello el nombre cuartil. En cambio para el percentil primero se ordenan los datos de menor a mayor y el percentil representa un valor por debajo del cual se encuentra un porcentaje dado de observaciones en un grupo. Para visualizar y entender mejor los datos se puede utilizar se puede utilizar un diagrama de caja de la librería ggplot2 para tener una idea mas clara de lo que representan estos datos, o bien un histograma para visualizar las frecuencias de un conjunto de datos.