1. Cargar Librerías
library(readr)
library (ggplot2)
library(resumeRdesc)
  1. Cargar o construir datos
set.seed(2020)
n <-  100
media.edad <- 30; ds.edad <- 15
media.peso <- 70; ds.peso <- 20
media.estatura <- 1.90; ds.estatura <- 0.15
edad <- round(rnorm(n = n, mean = media.edad, sd = ds.edad),0)
peso <- round(rnorm(n = n, mean = media.peso, sd = ds.peso),2)
estatura <- round(rnorm(n = n, mean = media.estatura, sd = ds.estatura),2)

personas <- data.frame(edad, peso, estatura)

head(personas); tail(personas)
##   edad  peso estatura
## 1   36 35.42     1.79
## 2   35 50.17     2.03
## 3   14 58.29     1.84
## 4   13 77.67     1.96
## 5  -12 84.93     1.74
## 6   41 51.43     1.71
##     edad  peso estatura
## 95    27 55.46     1.95
## 96    18 82.53     1.80
## 97    35 48.17     1.82
## 98    40 59.68     2.17
## 99    22 70.34     1.76
## 100   20 83.22     1.81
  1. Cuartiles al 25%, 50%, 75%
cuartiles <- quantile(personas$edad, probs = c(0.25, 0.50, 0.75), type = 6)
cuartiles[1]
##   25% 
## 21.25
cuartiles[2]
## 50% 
##  32
cuartiles[3]
##   75% 
## 41.75
cuartiles <- quantile(personas$peso, probs = c(0.25, 0.50, 0.75), type = 6)
cuartiles[1]
##    25% 
## 49.375
cuartiles[2]
##    50% 
## 68.855
cuartiles[3]
##    75% 
## 84.505
cuartiles <- quantile(personas$estatura, probs = c(0.25, 0.50, 0.75), type = 6)
cuartiles[1]
##    25% 
## 1.7625
cuartiles[2]
##   50% 
## 1.885
cuartiles[3]
## 75% 
##   2
  1. Percentiles
percentil <- quantile(personas$edad, probs = c(0.10, 0.30, 0.50, 0.70, 0.90), type = 7)
percentil[1]
##  10% 
## 11.8
percentil[2]
##  30% 
## 24.7
percentil[3]
## 50% 
##  32
percentil[4]
## 70% 
##  39
percentil[5]
##  90% 
## 55.1
percentil <- quantile(personas$peso, probs = c(0.10, 0.30, 0.50, 0.70, 0.90), type = 7)
percentil[1]
##    10% 
## 37.878
percentil[2]
##    30% 
## 54.406
percentil[3]
##    50% 
## 68.855
percentil[4]
##    70% 
## 80.152
percentil[5]
##    90% 
## 94.931
percentil <- quantile(personas$estatura, probs = c(0.10, 0.30, 0.50, 0.70, 0.90), type = 7)
percentil[1]
##   10% 
## 1.668
percentil[2]
##  30% 
## 1.79
percentil[3]
##   50% 
## 1.885
percentil[4]
##   70% 
## 1.973
percentil[5]
##  90% 
## 2.09
  1. Visualizar datos
ggplot(data = personas, aes(edad, colour ='edad')) +
    geom_histogram(position = "stack", bins = 30)

ggplot(data = personas, aes(edad, colour = 'edad')) +
    geom_density()

ggplot(data = personas, aes(edad)) +
    geom_histogram(bins = 30) + 
    geom_vline(aes(xintercept = median(edad),
                  color = "mediana"),
              linetype = "dashed",
              size = 1) +
    geom_vline(aes(xintercept = mean(edad),
                  color = "media"),
              linetype = "dashed",
              size = 1) +
  labs(title = "Histograma de Edad",subtitle =  paste("Media = ", round(mean(edad),2), ", Mediana = ", round(median(edad),2)))

ggplot(data = personas, aes(edad)) +
    geom_histogram(bins = 30) + 
    geom_vline(aes(xintercept = cuartiles[1],
                  color = "Q1"),
              linetype = "dashed",
              size = 1) +
    geom_vline(aes(xintercept = cuartiles[2],
                  color = "Q2"),
              linetype = "dashed",
              size = 1) +
    geom_vline(aes(xintercept = cuartiles[3],
                  color = "Q3"),
              linetype = "dashed",
              size = 1) +  
  labs(title = "Histograma de Edad",subtitle =  paste("Cuartil 1 al 25% = ",round(cuartiles[1],2), ", Cuartil 2 al 50% = ",round(cuartiles[2],2), ", Cuartil 3 al 75% = ",round(cuartiles[3],2)))

ggplot(data = personas, aes(edad)) +
    geom_histogram(bins = 30) + 
    geom_vline(aes(xintercept = percentil[1],
                  color = "Perc1"),
              linetype = "solid",
              size = 2) +
    geom_vline(aes(xintercept = percentil[2],
                  color = "Perc2"),
              linetype = "solid",
              size = 2) +
    geom_vline(aes(xintercept = percentil[3],
                  color = "Perc3"),
              linetype = "solid",
              size = 2) +  
      geom_vline(aes(xintercept = percentil[4],
                  color = "Perc4"),
              linetype = "solid",
              size = 2) +
    geom_vline(aes(xintercept = percentil[5],
                  color = "Perc5"),
              linetype = "solid",
              size = 2) + 
  labs(title = "Histograma de Edad. Perc = Percentiles",subtitle =  paste("Perc al 10% = ",round(percentil[1],2), "Perc al 30% = ",round(percentil[2],2),"Perc al 50% = ",round(percentil[3],2),"Perc al 70% = ",round(percentil[4],2),"Perc al 90% = ",round(percentil[5],2)))

  1. Interpretar y comunicar datos

Los cuartiles son valores que dividen una muestra de datos en cuatro partes iguales. Utilizando cuartiles puede evaluar rápidamente la dispersión y la tendencia central de un conjunto de datos, que son los pasos iniciales importantes para comprender sus datos.

Los percentiles son valores que dividen un conjunto de datos estadísticos, de forma que un porcentaje de los mismos quede por debajo de dicho valor