Realizar cálculos para determinar medidas de localización y tendencia central como CUARTILES Y PERCENTILES con un conjunto de datos de personas
Con un conjunto de datos de personas y con variables de interés como la edad, peso y estatura, determinar medidas de localización y tendencia central, se pide mostrar los datos, identificar las medidas visualizar gráficamente e interpretar las medidas.
library(readr)
library(ggplot2)
library(resumeRdesc)
set.seed(2020)
n <- 100
sexo <- c("Masculino", 'Femenino')
Edad <- sample(20:50, n , replace = TRUE)
Peso <- sample(40:80, n , replace = TRUE)
Estatura <- sample(160:190, n , replace = TRUE) / 100
Genero <- sample(sexo, n , replace = TRUE)
Datos <- data.frame(Edad,Peso,Estatura,Genero)
Datos
## Edad Peso Estatura Genero
## 1 47 55 1.71 Masculino
## 2 31 45 1.71 Femenino
## 3 42 63 1.81 Masculino
## 4 41 65 1.84 Femenino
## 5 43 49 1.71 Femenino
## 6 20 65 1.71 Masculino
## 7 36 72 1.88 Masculino
## 8 23 67 1.69 Femenino
## 9 29 40 1.72 Femenino
## 10 25 56 1.86 Femenino
## 11 36 79 1.72 Femenino
## 12 32 54 1.69 Masculino
## 13 43 52 1.68 Femenino
## 14 27 44 1.71 Masculino
## 15 29 63 1.88 Masculino
## 16 37 59 1.84 Masculino
## 17 35 59 1.83 Femenino
## 18 41 53 1.84 Femenino
## 19 48 52 1.84 Masculino
## 20 21 67 1.78 Masculino
## 21 35 56 1.61 Femenino
## 22 22 69 1.76 Masculino
## 23 21 78 1.71 Masculino
## 24 48 80 1.63 Femenino
## 25 43 79 1.70 Femenino
## 26 27 66 1.78 Masculino
## 27 23 68 1.78 Femenino
## 28 37 74 1.78 Masculino
## 29 33 74 1.88 Masculino
## 30 33 41 1.78 Masculino
## 31 31 52 1.68 Femenino
## 32 35 47 1.61 Masculino
## 33 34 62 1.81 Femenino
## 34 33 71 1.79 Masculino
## 35 26 43 1.66 Femenino
## 36 39 78 1.89 Femenino
## 37 37 75 1.67 Masculino
## 38 39 63 1.73 Masculino
## 39 40 80 1.71 Masculino
## 40 39 68 1.84 Masculino
## 41 35 67 1.63 Femenino
## 42 31 41 1.82 Masculino
## 43 46 71 1.69 Femenino
## 44 41 56 1.78 Femenino
## 45 37 56 1.72 Femenino
## 46 29 76 1.86 Femenino
## 47 50 49 1.62 Femenino
## 48 25 50 1.86 Femenino
## 49 34 56 1.81 Masculino
## 50 30 78 1.86 Masculino
## 51 32 52 1.79 Masculino
## 52 47 49 1.82 Femenino
## 53 43 77 1.66 Femenino
## 54 32 60 1.87 Femenino
## 55 32 49 1.64 Femenino
## 56 21 50 1.79 Femenino
## 57 50 42 1.86 Femenino
## 58 35 64 1.66 Masculino
## 59 32 70 1.80 Femenino
## 60 20 62 1.81 Femenino
## 61 25 43 1.86 Femenino
## 62 22 60 1.80 Masculino
## 63 48 80 1.84 Masculino
## 64 44 76 1.72 Femenino
## 65 32 42 1.75 Masculino
## 66 30 65 1.85 Femenino
## 67 44 40 1.75 Femenino
## 68 24 68 1.78 Masculino
## 69 30 53 1.85 Femenino
## 70 45 63 1.69 Masculino
## 71 25 66 1.63 Femenino
## 72 21 78 1.63 Femenino
## 73 44 57 1.68 Masculino
## 74 22 75 1.87 Femenino
## 75 43 58 1.75 Femenino
## 76 37 64 1.77 Masculino
## 77 20 77 1.60 Masculino
## 78 41 43 1.85 Femenino
## 79 26 49 1.72 Femenino
## 80 27 65 1.75 Femenino
## 81 40 63 1.69 Masculino
## 82 43 60 1.61 Femenino
## 83 32 74 1.72 Femenino
## 84 21 64 1.65 Femenino
## 85 24 61 1.68 Femenino
## 86 41 72 1.83 Masculino
## 87 23 54 1.78 Masculino
## 88 38 70 1.62 Femenino
## 89 35 51 1.74 Masculino
## 90 49 70 1.89 Femenino
## 91 42 40 1.77 Masculino
## 92 23 66 1.85 Femenino
## 93 39 43 1.81 Masculino
## 94 37 42 1.83 Femenino
## 95 29 59 1.65 Femenino
## 96 20 63 1.61 Femenino
## 97 34 59 1.61 Masculino
## 98 41 68 1.63 Masculino
## 99 50 40 1.67 Femenino
## 100 28 78 1.68 Masculino
cuantilEdad <- quantile(Datos$Edad, probs = c(0.25,0.50,0.75))
cuantilPeso <- quantile(Datos$Peso, probs = c(0.25,0.50,0.75))
cuantileEstatura <- quantile(Datos$Estatura, probs = c(0.25,0.50,0.75))
cuantilEdad
## 25% 50% 75%
## 27 34 41
cuantilPeso
## 25% 50% 75%
## 52.0 62.5 70.0
cuantileEstatura
## 25% 50% 75%
## 1.68 1.75 1.83
cat("No es necesario sacar el de genero por que solo tiene 2 variables")
## No es necesario sacar el de genero por que solo tiene 2 variables
PercentilEdad <- quantile(Datos$Edad, probs = c(0.1,0.3,0.5,0.7,0.9))
PercentilPeso <- quantile(Datos$Peso, probs = c(0.1,0.3,0.5,0.7,0.9))
PercentilEstatura <- quantile(Datos$Estatura, probs = c(0.1,0.3,0.5,0.7,0.9))
PercentilEdad
## 10% 30% 50% 70% 90%
## 22.0 29.0 34.0 39.3 45.1
PercentilPeso
## 10% 30% 50% 70% 90%
## 43.0 53.7 62.5 68.0 77.1
PercentilEstatura
## 10% 30% 50% 70% 90%
## 1.63 1.69 1.75 1.81 1.86
cat("De nuevo no es necesario sacar el de genero por que solo tiene 2 variables")
## De nuevo no es necesario sacar el de genero por que solo tiene 2 variables
Utilizar la librería ggplot2}
Histograma
ggplot(data = Datos, aes(Edad, colour = 'edad')) +
geom_histogram(position = "stack", bins = 30)
ggplot(data = Datos, aes(Edad, colour = 'edad')) +
geom_density()
ggplot(data = Datos, aes(Edad)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = cuantilEdad[1],
color = "Q1"),
linetype = "dashed",
size = 1) +
geom_vline(aes(xintercept = cuantilEdad[2],
color = "Q2"),
linetype = "dashed",
size = 1) +
geom_vline(aes(xintercept = cuantilEdad[3],
color = "Q3"),
linetype = "dashed",
size = 1) +
labs(title = "Histograma de Edad",subtitle = paste("Cuartil 1 al 25% = ",round(cuantilEdad[1],2), ", Cuartil 2 al 50% = ",round(cuantilEdad[2],2), ", Cuartil 3 al 75% = ",round(cuantilEdad[3],2)))
ggplot(data = Datos, aes(Edad)) +
geom_histogram(bins = 30) +
geom_vline(aes(xintercept = PercentilEdad[1],
color = "Perc1"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = PercentilEdad[2],
color = "Perc2"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = PercentilEdad[3],
color = "Perc3"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = PercentilEdad[4],
color = "Perc4"),
linetype = "solid",
size = 2) +
geom_vline(aes(xintercept = PercentilEdad[5],
color = "Perc5"),
linetype = "solid",
size = 2) +
labs(title = "Histograma de Edad. Perc = Percentiles",subtitle = paste("Perc al 10% = ",round(PercentilEdad[1],2), "Perc al 30% = ",round(PercentilEdad[2],2),"Perc al 50% = ",round(PercentilEdad[3],2),"Perc al 70% = ",round(PercentilEdad[4],2),"Perc al 90% = ",round(PercentilEdad[5],2)))