Objetivo

Realizar cálculos para determinar medidas de localización y tendencia central como CUARTILES Y PERCENTILES con un conjunto de datos de personas

  1. Cargar librerias
library(readr)
library (ggplot2)
library(resumeRdesc)  # No se si la usamos pero ...
  1. Construir datos
set.seed(2020)
n <-  100
media.edad <- 50; ds.edad <- 15
media.peso <- 85; ds.peso <- 30
media.estatura <- 1.90; ds.estatura <- 0.50
edad <- round(rnorm(n = n, mean = media.edad, sd = ds.edad),0)
peso <- round(rnorm(n = n, mean = media.peso, sd = ds.peso),2)
estatura <- round(rnorm(n = n, mean = media.estatura, sd = ds.estatura),2)

personas <- data.frame(edad, peso, estatura)

head(personas); tail(personas)
##   edad   peso estatura
## 1   56  33.14     1.54
## 2   55  55.26     2.33
## 3   34  67.43     1.70
## 4   33  96.51     2.10
## 5    8 107.40     1.38
## 6   61  57.15     1.27
##     edad   peso estatura
## 95    47  63.18     2.06
## 96    38 103.80     1.55
## 97    55  52.26     1.64
## 98    60  69.52     2.81
## 99    42  85.51     1.42
## 100   40 104.83     1.61
  1. Cuartiles al 25%, 50% y 75% # edad
cuartiles <- quantile(personas$edad, probs = c(0.25, 0.50, 0.75), type = 6)
cuartiles[1]
##   25% 
## 41.25
cuartiles[2]
## 50% 
##  52
cuartiles[3]
##   75% 
## 61.75

peso

cuartiles <- quantile(personas$peso, probs = c(0.25, 0.50, 0.75), type = 6)
cuartiles[1]
##   25% 
## 54.06
cuartiles[2]
##   50% 
## 83.28
cuartiles[3]
##      75% 
## 106.7625

estatura

cuartiles <- quantile(personas$estatura, probs = c(0.25, 0.50, 0.75), type = 6)
cuartiles[1]
##   25% 
## 1.435
cuartiles[2]
##  50% 
## 1.84
cuartiles[3]
##   75% 
## 2.235
  1. Percentiles
percentil <- quantile(personas$edad, probs = c(0.10, 0.30, 0.50, 0.70, 0.90), type = 7)
percentil[1]
##  10% 
## 31.8
percentil[2]
##  30% 
## 44.7
percentil[3]
## 50% 
##  52
percentil[4]
## 70% 
##  59
percentil[5]
##  90% 
## 75.1

peso

percentil <- quantile(personas$peso, probs = c(0.10, 0.30, 0.50, 0.70, 0.90), type = 7)
percentil[1]
##    10% 
## 36.813
percentil[2]
##    30% 
## 61.604
percentil[3]
##   50% 
## 83.28
percentil[4]
##    70% 
## 100.23
percentil[5]
##     90% 
## 122.396

estatura

percentil <- quantile(personas$estatura, probs = c(0.10, 0.30, 0.50, 0.70, 0.90), type = 7)
percentil[1]
##   10% 
## 1.142
percentil[2]
##   30% 
## 1.537
percentil[3]
##  50% 
## 1.84
percentil[4]
##   70% 
## 2.143
percentil[5]
##   90% 
## 2.521
  1. Vizualizar datos
ggplot(data = personas, aes(edad, colour = 'edad')) +
    geom_histogram(position = "stack", bins = 30)

ggplot(data = personas, aes(edad, colour = 'edad')) +
    geom_density()

ggplot(data = personas, aes(edad)) +
    geom_histogram(bins = 30) + 
    geom_vline(aes(xintercept = median(edad),
                  color = "mediana"),
              linetype = "dashed",
              size = 1) +
    geom_vline(aes(xintercept = mean(edad),
                  color = "media"),
              linetype = "dashed",
              size = 1) +
  labs(title = "Histograma de Edad",subtitle =  paste("Media = ", round(mean(edad),2), ", Mediana = ", round(median(edad),2))) 

ggplot(data = personas, aes(edad)) +
    geom_histogram(bins = 30) + 
    geom_vline(aes(xintercept = cuartiles[1],
                  color = "Q1"),
              linetype = "dashed",
              size = 1) +
    geom_vline(aes(xintercept = cuartiles[2],
                  color = "Q2"),
              linetype = "dashed",
              size = 1) +
    geom_vline(aes(xintercept = cuartiles[3],
                  color = "Q3"),
              linetype = "dashed",
              size = 1) +  
  labs(title = "Histograma de Edad",subtitle =  paste("Cuartil 1 al 25% = ",round(cuartiles[1],2), ", Cuartil 2 al 50% = ",round(cuartiles[2],2), ", Cuartil 3 al 75% = ",round(cuartiles[3],2)))

ggplot(data = personas, aes(edad)) +
    geom_histogram(bins = 30) + 
    geom_vline(aes(xintercept = percentil[1],
                  color = "Perc1"),
              linetype = "solid",
              size = 2) +
    geom_vline(aes(xintercept = percentil[2],
                  color = "Perc2"),
              linetype = "solid",
              size = 2) +
    geom_vline(aes(xintercept = percentil[3],
                  color = "Perc3"),
              linetype = "solid",
              size = 2) +  
      geom_vline(aes(xintercept = percentil[4],
                  color = "Perc4"),
              linetype = "solid",
              size = 2) +
    geom_vline(aes(xintercept = percentil[5],
                  color = "Perc5"),
              linetype = "solid",
              size = 2) + 
  labs(title = "Histograma de Edad. Perc = Percentiles",subtitle =  paste("Perc al 10% = ",round(percentil[1],2), "Perc al 30% = ",round(percentil[2],2),"Perc al 50% = ",round(percentil[3],2),"Perc al 70% = ",round(percentil[4],2),"Perc al 90% = ",round(percentil[5],2)))

7. Interpretar y comunicar datos

Los cuartiles son una herramienta que usamos en la estadística y que nos sirve para administrar grupos de datos previamente ordenados. Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q_1, Q_2 y Q_3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q_2 coincide con la mediana. El primer cuartil se calcula interpolando entre los valores f inmediatamente superior e inferior a 0,25, para obtener el valor correspondiente al valor f 0,25. El tercer cuartil se calcula interpolando entre los valores f inmediatamente superior e inferior a 0,75, para obtener el valor correspondiente al valor f 0,75. Los demás percentiles se calculan de la misma forma, interpolando entre los valores adecuados.