Objetivo

Realizar cálculos para determinar medidas de localización y tendencia central como CUARTILES Y PERCENTILES con un conjunto de datos de personas

Descripción

Con un conjunto de datos de personas y con variables de interés como la edad, peso y estatura, determinar medidas de localización y tendencia central, se pide mostrar los datos, identificar las medidas visualizar gráficamente e interpretar las medidas.

1. Cargar librerías

library(readr)
library (ggplot2)

2. Construir los datos. 100 observaciones

set.seed(732)

Simular los datos, utilizar rnorm()

n Total de observaciones de la muestra

edades en donde la media sea 45 años y desviación stándard igual a 10 años

pesos en donde la media sea 75 kgs y desviación standard = 15 kgs

estaturas en donde la media sea 1.70 y desviación estándard igual a 0.10

Construir un conjunto de datos llamado personas

Modificar en caso necesario el nombre del conjunto de datos personas a #### ‘edad’, ‘peso’ y ‘estatura’ con la función name()

Mostrar el conjunto de datos personas

Pimero inicializar variables como medias y desviaciones de las variables #### de interés: edad, peso y estatura

n <-  100
media.edad <- 45; ds.edad <- 10
media.peso <- 75; ds.peso <- 15
media.estatura <- 1.70; ds.estatura <- 0.10

Segundo Contruir el conjunto de datos personas head(personas); tail(personas), los primeros y últimos seis registros u observaciones del conjunto de datos rnorm() está generando números aleatorios basados en una media y en una desviación estandard

edad <- round(rnorm(n = n, mean = media.edad, sd = ds.edad),0)
peso <- round(rnorm(n = n, mean = media.peso, sd = ds.peso),2)
estatura <- round(rnorm(n = n, mean = media.estatura, sd = ds.estatura),2)

personas <- data.frame(edad, peso, estatura)

head(personas); tail(personas)
##   edad  peso estatura
## 1   45 74.96     1.67
## 2   66 73.47     1.69
## 3   37 69.27     1.87
## 4   36 68.16     1.59
## 5   60 81.60     1.79
## 6   44 59.14     1.69
##     edad  peso estatura
## 95    27 59.02     1.67
## 96    47 84.45     1.73
## 97    46 88.35     1.79
## 98    56 90.32     1.69
## 99    46 72.91     1.59
## 100   41 46.54     1.71

5 Visualizar datos

Variable de interés estatura. Hacer diagrama de caja de estaturas. se utiliza ggplot o en su defecto solo boxplot

ggplot(data = personas, aes(y=estatura)) +
         geom_boxplot() +
  labs(title = "Cuartiles de estatura" ,subtitle =  paste("Q1 al 25% = ",round(quantile(personas$estatura, 0.25),2), "Q2 al 50% = ",round(quantile(personas$estatura), 2),"Q3 al 75% = ",round(quantile(personas$estatura),2)))

# o

boxplot(personas$estatura)

En este caso identificaremos las medidas centrales de tendencia y visualizamos dichos datos en gráficas. Los cuartiles son medidas estadísticas de posición que tienen la propiedad de dividir la serie estadística en cuatro grupos de números iguales de términos. construimos con tres variables edad, peso y estatura en un conjunto de 100 muestras nuestro primer cuartil de estaturas al 25% es igual al 1.63, nuestro segundo cuartil al 50% es igual a 1.42 y por último el tercero al 75% es igual 1.42.