Objetivo

Realizar cálculos para determinar medidas de localización y tendencia central como la media, mediana, moda con un conjunto de datos de personas

####Descripción Con un conjunto de datos de personas y con variables de interés como la edad, peso y estatura, determinar medidas de localización y tendencia central, se pide mostrar los datos, identificar las medidas visualizar gráficamente e interpretarlas medidas.

Paso 1. Cargar las librerías

library(resumeRdesc)
library(ggplot2)
library(readr)

Paso 2. Cargar los datos

set.seed(2020)

n=100
edades= sample(15:65, n, replace = TRUE)
pesos= sample(40:100, n, replace = TRUE)
alturas= sample(140:205, n, replace = TRUE)/100

personas=data.frame(edades, pesos, alturas)
names(personas)= c("edades", "pesos", "alturas" )
personas
##     edades pesos alturas
## 1       42    97    1.97
## 2       58    89    1.77
## 3       37    52    1.43
## 4       36    44    1.65
## 5       38    63    1.60
## 6       15    87    1.64
## 7       31    59    1.72
## 8       50    91    1.70
## 9       56    59    1.70
## 10      20    53    1.40
## 11      63    52    1.90
## 12      59    67    1.43
## 13      22    56    1.42
## 14      56    69    1.59
## 15      64    84    1.98
## 16      30    78    1.63
## 17      43    80    1.59
## 18      48    99    1.83
## 19      62    99    1.68
## 20      17    79    1.40
## 21      16    66    1.83
## 22      43    68    1.83
## 23      54    92    1.61
## 24      18    74    1.96
## 25      64    98    1.51
## 26      28    74    1.51
## 27      28    41    2.00
## 28      26    52    1.49
## 29      62    47    1.52
## 30      61    62    1.66
## 31      28   100    1.96
## 32      21    71    1.41
## 33      34    43    1.88
## 34      32    78    1.83
## 35      35    85    1.50
## 36      62    88    1.90
## 37      58    94    1.80
## 38      32    92    1.41
## 39      24    75    1.93
## 40      45    63    1.59
## 41      20    87    1.46
## 42      61    80    2.01
## 43      57    99    1.53
## 44      27    68    1.64
## 45      46    67    1.75
## 46      38    93    1.62
## 47      27    41    1.90
## 48      59    71    2.03
## 49      16    56    1.52
## 50      45    56    1.66
## 51      30    76    1.66
## 52      27    49    1.59
## 53      15    90    1.62
## 54      52    86    1.67
## 55      17    50    1.91
## 56      43    90    1.78
## 57      39    56    1.92
## 58      59    78    1.84
## 59      57    52    1.87
## 60      39    49    1.55
## 61      19    77    1.65
## 62      57    94    1.81
## 63      52    95    1.67
## 64      16    60    1.89
## 65      39    49    2.04
## 66      49    98    1.81
## 67      38    50    1.73
## 68      64    99    1.84
## 69      47    86    1.45
## 70      21    42    1.90
## 71      22    64    1.42
## 72      35    83    1.86
## 73      27    70    1.65
## 74      48    62    1.93
## 75      19    90    1.95
## 76      18    84    1.77
## 77      33    87    1.73
## 78      62    43    1.43
## 79      37    60    1.82
## 80      18    99    1.81
## 81      32   100    1.80
## 82      56    80    1.69
## 83      15    76    1.71
## 84      61    91    1.95
## 85      36    95    1.70
## 86      45    98    1.77
## 87      55    42    1.66
## 88      30    97    1.86
## 89      20    65    1.50
## 90      38    93    1.41
## 91      40    40    1.40
## 92      24    68    1.46
## 93      40    53    1.58
## 94      47    63    1.92
## 95      42    66    1.84
## 96      15    78    1.51
## 97      31    57    1.93
## 98      54    75    1.50
## 99      29    58    1.98
## 100     58    64    1.67

Paso 3. Obtener la media

mediaE <- mean(personas$edades)
paste("La media de la variable Edad es", round(mediaE), "Años")
## [1] "La media de la variable Edad es 39 Años"
mediaP <- mean(personas$pesos)
paste("La media de la variable Peso es", mediaP, "Kilogramos" )
## [1] "La media de la variable Peso es 72.65 Kilogramos"
mediaA <- mean(personas$alturas)
paste("La media de la variable Altura es", round(mediaA,2), "Metros" )
## [1] "La media de la variable Altura es 1.71 Metros"

Paso 4. Obtener la mediana

medianaE <- median(personas$edades)
paste("La mediana de la variable Edad es", medianaE)
## [1] "La mediana de la variable Edad es 38"
medianaP <- median(personas$pesos)
paste("La mediana de la variable Pesos es", medianaP)
## [1] "La mediana de la variable Pesos es 74"
medianaA <- median(personas$alturas)
paste("La mediana de la variable Altura es", medianaA)
## [1] "La mediana de la variable Altura es 1.7"

Paso 5. Obtener la moda

frecuenciaE=table(personas$edades)
frecuenciaE=sort(frecuenciaE, decreasing = TRUE)
modaE = frecuenciaE[1]
cat("La moda de edad es", names(modaE), "La cual se repitio ", frecuenciaE[1], "veces")
## La moda de edad es 15 La cual se repitio  4 veces
frecuenciaP=table(personas$pesos)
frecuenciaP=sort(frecuenciaP, decreasing = TRUE)
modaP = frecuenciaP[1]
cat("La moda de peso es", names(modaP), "La cual se repitio ", frecuenciaP[1], "veces")
## La moda de peso es 99 La cual se repitio  5 veces
frecuenciaA=table(personas$alturas)
frecuenciaA=sort(frecuenciaA, decreasing = TRUE)
modaA = frecuenciaA[1]
cat("La moda de altura es", names(modaA), "La cual se repitio ", frecuenciaA[1], "veces")
## La moda de altura es 1.59 La cual se repitio  4 veces
print("¿Es una moda, bimodal o multimodal ?")
## [1] "¿Es una moda, bimodal o multimodal ?"
modaE=Mode(personas$edades)
modaE
## [1] 15 27 38 62
modaP=Mode(personas$pesos)
modaP
## [1] 99
modaA=Mode(personas$alturas)
modaA
## [1] 1.59 1.66 1.83 1.90

Paso 6. Visualizar los datos obtenidos

ggplot(data=personas, aes(x=edades))+
geom_bar()

ggplot(data = personas, aes(x = edades)) +
  geom_histogram(bins = 30)

ggplot(personas, aes(x=edades)) + 
  geom_histogram(aes(fill=..count..), bins=20, color="white") +
  geom_vline(aes(xintercept=mean(edades)), color="red") +
  geom_vline(aes(xintercept=median(edades)), color= "darkgreen")

ggplot(aes(x = edades), data = personas) +
 geom_histogram(color = 'green',
                fill = 'green',
                alpha = 0.2) +
 labs(title = "Histograma de Edades") +
  geom_vline(aes(xintercept = median(edades),
                  color = "mediana"),
              linetype = "dashed",
              size = 1) +
   geom_vline(aes(xintercept = mean(edades),
                  color = "media"),
              linetype = "dashed",
              size = 1) +
  geom_vline(
     aes(xintercept = modaE[1],
         color = "moda"),
     linetype = "dashed",
     size = 1
   )
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Paso 7. Interpretacion de los datos

En este caso pudimos observar la gran utilidad que representa la herramienta R, para obtener un excelente manejo de los datos, las gráficas representadas de una manera más limpia, nos ayuda a entender de una manera más rápida el contenido de las estadísticas obtenidas. Las medidas de tendencia manejadas en el caso número 3, nos ayudan a encontrar datos de una manera más rápida, podemos obtener de una manera muy rápida y cómoda los valores que se encuentran en el centro, saber con exactitud la media de nuestros datos, lo cual es de gran utilidad a la hora de analizar los datos