Objetivo

Realizar cálculos para determinar medidas de localización y tendencia central como CUARTILES Y PERCENTILES con un conjunto de datos de personas

Descripción

Con un conjunto de datos de personas y con variables de interés como la edad, peso y estatura, determinar medidas de localización y tendencia central, se pide mostrar los datos, identificar las medidas visualizar gráficamente e interpretar las medidas.

Cargar librerias

  1. library(readr)
  2. library(ggplot2)
  3. library(resumeRdesc)
library(readr)
library(ggplot2)
library(resumeRdesc)
set.seed(2020)

Cargar o construir los datos

n <- 100
sexo <- c("Masculino", 'Femenino')
Edad <- sample(20:50, n , replace = TRUE)
Peso <- sample(40:80, n , replace = TRUE)
Estatura <- sample(160:190, n , replace = TRUE) / 100
Genero <- sample(sexo, n , replace = TRUE)


Datos <- data.frame(Edad,Peso,Estatura,Genero)
Datos
##     Edad Peso Estatura    Genero
## 1     47   55     1.71 Masculino
## 2     31   45     1.71  Femenino
## 3     42   63     1.81 Masculino
## 4     41   65     1.84  Femenino
## 5     43   49     1.71  Femenino
## 6     20   65     1.71 Masculino
## 7     36   72     1.88 Masculino
## 8     23   67     1.69  Femenino
## 9     29   40     1.72  Femenino
## 10    25   56     1.86  Femenino
## 11    36   79     1.72  Femenino
## 12    32   54     1.69 Masculino
## 13    43   52     1.68  Femenino
## 14    27   44     1.71 Masculino
## 15    29   63     1.88 Masculino
## 16    37   59     1.84 Masculino
## 17    35   59     1.83  Femenino
## 18    41   53     1.84  Femenino
## 19    48   52     1.84 Masculino
## 20    21   67     1.78 Masculino
## 21    35   56     1.61  Femenino
## 22    22   69     1.76 Masculino
## 23    21   78     1.71 Masculino
## 24    48   80     1.63  Femenino
## 25    43   79     1.70  Femenino
## 26    27   66     1.78 Masculino
## 27    23   68     1.78  Femenino
## 28    37   74     1.78 Masculino
## 29    33   74     1.88 Masculino
## 30    33   41     1.78 Masculino
## 31    31   52     1.68  Femenino
## 32    35   47     1.61 Masculino
## 33    34   62     1.81  Femenino
## 34    33   71     1.79 Masculino
## 35    26   43     1.66  Femenino
## 36    39   78     1.89  Femenino
## 37    37   75     1.67 Masculino
## 38    39   63     1.73 Masculino
## 39    40   80     1.71 Masculino
## 40    39   68     1.84 Masculino
## 41    35   67     1.63  Femenino
## 42    31   41     1.82 Masculino
## 43    46   71     1.69  Femenino
## 44    41   56     1.78  Femenino
## 45    37   56     1.72  Femenino
## 46    29   76     1.86  Femenino
## 47    50   49     1.62  Femenino
## 48    25   50     1.86  Femenino
## 49    34   56     1.81 Masculino
## 50    30   78     1.86 Masculino
## 51    32   52     1.79 Masculino
## 52    47   49     1.82  Femenino
## 53    43   77     1.66  Femenino
## 54    32   60     1.87  Femenino
## 55    32   49     1.64  Femenino
## 56    21   50     1.79  Femenino
## 57    50   42     1.86  Femenino
## 58    35   64     1.66 Masculino
## 59    32   70     1.80  Femenino
## 60    20   62     1.81  Femenino
## 61    25   43     1.86  Femenino
## 62    22   60     1.80 Masculino
## 63    48   80     1.84 Masculino
## 64    44   76     1.72  Femenino
## 65    32   42     1.75 Masculino
## 66    30   65     1.85  Femenino
## 67    44   40     1.75  Femenino
## 68    24   68     1.78 Masculino
## 69    30   53     1.85  Femenino
## 70    45   63     1.69 Masculino
## 71    25   66     1.63  Femenino
## 72    21   78     1.63  Femenino
## 73    44   57     1.68 Masculino
## 74    22   75     1.87  Femenino
## 75    43   58     1.75  Femenino
## 76    37   64     1.77 Masculino
## 77    20   77     1.60 Masculino
## 78    41   43     1.85  Femenino
## 79    26   49     1.72  Femenino
## 80    27   65     1.75  Femenino
## 81    40   63     1.69 Masculino
## 82    43   60     1.61  Femenino
## 83    32   74     1.72  Femenino
## 84    21   64     1.65  Femenino
## 85    24   61     1.68  Femenino
## 86    41   72     1.83 Masculino
## 87    23   54     1.78 Masculino
## 88    38   70     1.62  Femenino
## 89    35   51     1.74 Masculino
## 90    49   70     1.89  Femenino
## 91    42   40     1.77 Masculino
## 92    23   66     1.85  Femenino
## 93    39   43     1.81 Masculino
## 94    37   42     1.83  Femenino
## 95    29   59     1.65  Femenino
## 96    20   63     1.61  Femenino
## 97    34   59     1.61 Masculino
## 98    41   68     1.63 Masculino
## 99    50   40     1.67  Femenino
## 100   28   78     1.68 Masculino

3.- Cuartiles al 25%, 50% y 75%

  1. edad
  2. peso
  3. estatura
cuantilEdad <- quantile(Datos$Edad, probs = c(0.25,0.50,0.75))
cuantilPeso <- quantile(Datos$Peso, probs = c(0.25,0.50,0.75))
cuantileEstatura <- quantile(Datos$Estatura, probs = c(0.25,0.50,0.75))


cuantilEdad
## 25% 50% 75% 
##  27  34  41
cuantilPeso
##  25%  50%  75% 
## 52.0 62.5 70.0
cuantileEstatura
##  25%  50%  75% 
## 1.68 1.75 1.83
cat("No es necesario sacar el de genero por que solo tiene 2 variables")
## No es necesario sacar el de genero por que solo tiene 2 variables

4. Percentiles al 10%, 30%, 50%, 70% y 90%

  1. edad
  2. peso
  3. estatura
PercentilEdad <- quantile(Datos$Edad, probs = c(0.1,0.3,0.5,0.7,0.9))
PercentilPeso <- quantile(Datos$Peso, probs = c(0.1,0.3,0.5,0.7,0.9))
PercentilEstatura <- quantile(Datos$Estatura, probs = c(0.1,0.3,0.5,0.7,0.9))

PercentilEdad
##  10%  30%  50%  70%  90% 
## 22.0 29.0 34.0 39.3 45.1
PercentilPeso
##  10%  30%  50%  70%  90% 
## 43.0 53.7 62.5 68.0 77.1
PercentilEstatura
##  10%  30%  50%  70%  90% 
## 1.63 1.69 1.75 1.81 1.86
cat("De nuevo no es necesario sacar el de genero por que solo tiene 2 variables")
## De nuevo no es necesario sacar el de genero por que solo tiene 2 variables

5. Visualizar datos

  1. Utilizar la librería ggplot2}

  2. Histograma

ggplot(data = Datos, aes(Edad, colour = 'edad')) +
    geom_histogram(position = "stack", bins = 30)

c. Densidad

ggplot(data = Datos, aes(Edad, colour = 'edad')) +
    geom_density()

d. Cuartiles

ggplot(data = Datos, aes(Edad)) +
    geom_histogram(bins = 30) + 
    geom_vline(aes(xintercept = cuantilEdad[1],
                  color = "Q1"),
              linetype = "dashed",
              size = 1) +
    geom_vline(aes(xintercept = cuantilEdad[2],
                  color = "Q2"),
              linetype = "dashed",
              size = 1) +
    geom_vline(aes(xintercept = cuantilEdad[3],
                  color = "Q3"),
              linetype = "dashed",
              size = 1) +  
  labs(title = "Histograma de Edad",subtitle =  paste("Cuartil 1 al 25% = ",round(cuantilEdad[1],2), ", Cuartil 2 al 50% = ",round(cuantilEdad[2],2), ", Cuartil 3 al 75% = ",round(cuantilEdad[3],2)))

e. Percentiles

ggplot(data = Datos, aes(Edad)) +
    geom_histogram(bins = 30) + 
    geom_vline(aes(xintercept = PercentilEdad[1],
                  color = "Perc1"),
              linetype = "solid",
              size = 2) +
    geom_vline(aes(xintercept = PercentilEdad[2],
                  color = "Perc2"),
              linetype = "solid",
              size = 2) +
    geom_vline(aes(xintercept = PercentilEdad[3],
                  color = "Perc3"),
              linetype = "solid",
              size = 2) +  
      geom_vline(aes(xintercept = PercentilEdad[4],
                  color = "Perc4"),
              linetype = "solid",
              size = 2) +
    geom_vline(aes(xintercept = PercentilEdad[5],
                  color = "Perc5"),
              linetype = "solid",
              size = 2) + 
  labs(title = "Histograma de Edad. Perc = Percentiles",subtitle =  paste("Perc al 10% = ",round(PercentilEdad[1],2), "Perc al 30% = ",round(PercentilEdad[2],2),"Perc al 50% = ",round(PercentilEdad[3],2),"Perc al 70% = ",round(PercentilEdad[4],2),"Perc al 90% = ",round(PercentilEdad[5],2)))

6. Interpretar y comunicar datos