CASO 3. Medidas de Localización. Medidas de Tendencia central

Objetivo

Realizar cálculos para determinar medidas de localización y tendencia central como la media, mediana, moda con un conjunto de datos de personas

Descripción

Con un conjunto de datos de personas y con variables de interés como la edad, peso y estatura, determinar medidas de localización y tendencia central, se pide mostrar los datos, identificar las medidas visualizar gráficamente e interpretarlas medidas.

Paso 1. Cargar las librerías

library(resumeRdesc)
library(ggplot2)
library(readr)

Paso 2. Cargar los datos

set.seed(2020)
n=100
edades= sample(15:65, n, replace = TRUE)
pesos= sample(40:100, n, replace = TRUE)
alturas= sample(140:205, n, replace = TRUE)/100

personas=data.frame(edades, pesos, alturas)
names(personas)= c("edades", "pesos", "alturas" )
personas
##     edades pesos alturas
## 1       42    97    1.97
## 2       58    89    1.77
## 3       37    52    1.43
## 4       36    44    1.65
## 5       38    63    1.60
## 6       15    87    1.64
## 7       31    59    1.72
## 8       50    91    1.70
## 9       56    59    1.70
## 10      20    53    1.40
## 11      63    52    1.90
## 12      59    67    1.43
## 13      22    56    1.42
## 14      56    69    1.59
## 15      64    84    1.98
## 16      30    78    1.63
## 17      43    80    1.59
## 18      48    99    1.83
## 19      62    99    1.68
## 20      17    79    1.40
## 21      16    66    1.83
## 22      43    68    1.83
## 23      54    92    1.61
## 24      18    74    1.96
## 25      64    98    1.51
## 26      28    74    1.51
## 27      28    41    2.00
## 28      26    52    1.49
## 29      62    47    1.52
## 30      61    62    1.66
## 31      28   100    1.96
## 32      21    71    1.41
## 33      34    43    1.88
## 34      32    78    1.83
## 35      35    85    1.50
## 36      62    88    1.90
## 37      58    94    1.80
## 38      32    92    1.41
## 39      24    75    1.93
## 40      45    63    1.59
## 41      20    87    1.46
## 42      61    80    2.01
## 43      57    99    1.53
## 44      27    68    1.64
## 45      46    67    1.75
## 46      38    93    1.62
## 47      27    41    1.90
## 48      59    71    2.03
## 49      16    56    1.52
## 50      45    56    1.66
## 51      30    76    1.66
## 52      27    49    1.59
## 53      15    90    1.62
## 54      52    86    1.67
## 55      17    50    1.91
## 56      43    90    1.78
## 57      39    56    1.92
## 58      59    78    1.84
## 59      57    52    1.87
## 60      39    49    1.55
## 61      19    77    1.65
## 62      57    94    1.81
## 63      52    95    1.67
## 64      16    60    1.89
## 65      39    49    2.04
## 66      49    98    1.81
## 67      38    50    1.73
## 68      64    99    1.84
## 69      47    86    1.45
## 70      21    42    1.90
## 71      22    64    1.42
## 72      35    83    1.86
## 73      27    70    1.65
## 74      48    62    1.93
## 75      19    90    1.95
## 76      18    84    1.77
## 77      33    87    1.73
## 78      62    43    1.43
## 79      37    60    1.82
## 80      18    99    1.81
## 81      32   100    1.80
## 82      56    80    1.69
## 83      15    76    1.71
## 84      61    91    1.95
## 85      36    95    1.70
## 86      45    98    1.77
## 87      55    42    1.66
## 88      30    97    1.86
## 89      20    65    1.50
## 90      38    93    1.41
## 91      40    40    1.40
## 92      24    68    1.46
## 93      40    53    1.58
## 94      47    63    1.92
## 95      42    66    1.84
## 96      15    78    1.51
## 97      31    57    1.93
## 98      54    75    1.50
## 99      29    58    1.98
## 100     58    64    1.67

Paso 3. Obtener la media

#### Media Edades
mediaE <- mean(personas$edades)
paste("La media de la variable Edad es", round(mediaE), "Años")
## [1] "La media de la variable Edad es 39 Años"
#### Media Pesos
mediaP <- mean(personas$pesos)
paste("La media de la variable Peso es", mediaP, "Kilogramos" )
## [1] "La media de la variable Peso es 72.65 Kilogramos"
#### Media Alturas
mediaA <- mean(personas$alturas)
paste("La media de la variable Altura es", round(mediaA,2), "Metros" )
## [1] "La media de la variable Altura es 1.71 Metros"

Paso 4. Obtener la mediana

#### Mediana Edades
medianaE <- median(personas$edades)
paste("La mediana de la variable Edad es", medianaE)
## [1] "La mediana de la variable Edad es 38"
#### Mediana Pesos
medianaP <- median(personas$pesos)
paste("La mediana de la variable Pesos es", medianaP)
## [1] "La mediana de la variable Pesos es 74"
#### Mediana Alturas
medianaA <- median(personas$alturas)
paste("La mediana de la variable Altura es", medianaA)
## [1] "La mediana de la variable Altura es 1.7"

Paso 5. Obtener la moda

#### Moda Edades
frecuenciaE=table(personas$edades)
frecuenciaE=sort(frecuenciaE, decreasing = TRUE)
modaE = frecuenciaE[1]
cat("La moda de edad es", names(modaE), "La cual se repitio ", frecuenciaE[1], "veces")
## La moda de edad es 15 La cual se repitio  4 veces
#### Moda Pesos
frecuenciaP=table(personas$pesos)
frecuenciaP=sort(frecuenciaP, decreasing = TRUE)
modaP = frecuenciaP[1]
cat("La moda de peso es", names(modaP), "La cual se repitio ", frecuenciaP[1], "veces")
## La moda de peso es 99 La cual se repitio  5 veces
#### Moda Altura
frecuenciaA=table(personas$alturas)
frecuenciaA=sort(frecuenciaA, decreasing = TRUE)
modaA = frecuenciaA[1]
cat("La moda de altura es", names(modaA), "La cual se repitio ", frecuenciaA[1], "veces")
## La moda de altura es 1.59 La cual se repitio  4 veces
print("¿Es una moda, bimodal o multimodal ?")
## [1] "¿Es una moda, bimodal o multimodal ?"
modaE=Mode(personas$edades)
modaE
## [1] 15 27 38 62
modaP=Mode(personas$pesos)
modaP
## [1] 99
modaA=Mode(personas$alturas)
modaA
## [1] 1.59 1.66 1.83 1.90

Paso 6. Visualizar los datos obtenidos

#### Gráfica de barra de edades
ggplot(data=personas, aes(x=edades))+
geom_bar()

#### Histograma de edades
ggplot(data = personas, aes(x = edades)) +
  geom_histogram(bins = 30)

#### Histograma de edades con medidas de localización
ggplot(personas, aes(x=edades)) + 
  geom_histogram(aes(fill=..count..), bins=20, color="white") +
  geom_vline(aes(xintercept=mean(edades)), color="red") +
  geom_vline(aes(xintercept=median(edades)), color= "darkgreen")

#### Gráfico más completo
ggplot(aes(x = edades), data = personas) +
 geom_histogram(color = 'green',
                fill = 'green',
                alpha = 0.2) +
 labs(title = "Histograma de Edades") +
  geom_vline(aes(xintercept = median(edades),
                  color = "mediana"),
              linetype = "dashed",
              size = 1) +
   geom_vline(aes(xintercept = mean(edades),
                  color = "media"),
              linetype = "dashed",
              size = 1) +
  geom_vline(
     aes(xintercept = modaE[1],
         color = "moda"),
     linetype = "dashed",
     size = 1
   )
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Paso 7. Interpretacion de los datos

Con los datos que se obtuvieron de cada persona los cuales fueron el peso, la edad y su altura se pudieron implrementar cada formula para poder sacar tanto la media como la moda y mediana de cada dato, se dio uso a una libreria “ggplot” la cual ayuda a la hora de la creacion de graficas con una mejor vista de los datos obtenidos.