Medidas de localizacion

Objetivo

Realizar cálculos para determinar medidas de localización y tendencia central como la media, mediana, moda con un conjunto de datos de personas

Descripcion

Con un conjunto de datos de personas y con variables de interés como la edad, peso y estatura, determinar medidas de localización y tendencia central, se pide mostrar los datos, identificar las medidas visualizar gráficamente e interpretar las medidas.

1.- Cargar librerias

  1. library(readr)
  2. library(ggplot2)
  3. library(resumeRdesc)
library(readr)
library(ggplot2)
library(resumeRdesc)

2.- Cargar o construir los datos.

  1. 100 datos aleatorios.
  2. Edades aleatorias de 15 años a 65 años.
  3. Estatura aleatoria de 1.4m a 2.05m.
  4. Peso aleatorio de 40kg a 100kg.
n <- 100;
Edad <- sample(15:65, n , replace = TRUE)
Estatura <- sample(140:205, n , replace = TRUE)/100
Peso <- sample(40:100, n , replace = TRUE)

personas<- data.frame(Edad,Peso,Estatura)
names(personas) <- c("edad", "peso","Estatura")
personas
##     edad peso Estatura
## 1     55   98     1.53
## 2     50   96     2.04
## 3     37   54     1.50
## 4     48   88     1.47
## 5     54   65     1.54
## 6     65   69     1.73
## 7     28   86     1.97
## 8     58  100     1.83
## 9     46   93     1.86
## 10    26   55     1.97
## 11    32   93     1.52
## 12    30   88     1.90
## 13    15   79     1.71
## 14    17   45     1.87
## 15    32   71     1.75
## 16    15   51     1.55
## 17    26   43     1.98
## 18    55   77     1.42
## 19    39   73     1.72
## 20    52   53     1.74
## 21    15   79     1.68
## 22    64   59     1.47
## 23    26   62     1.95
## 24    20   95     1.87
## 25    43   90     1.69
## 26    51   51     1.76
## 27    55   52     1.70
## 28    36   77     1.65
## 29    22   50     1.74
## 30    27   42     1.60
## 31    38   92     1.41
## 32    53   46     1.51
## 33    23  100     1.74
## 34    45   90     1.73
## 35    50   52     1.85
## 36    53   42     1.78
## 37    23   76     1.92
## 38    62   96     1.41
## 39    38   45     1.90
## 40    49   87     1.62
## 41    41   57     1.43
## 42    15   72     1.58
## 43    56   80     1.95
## 44    25   76     1.74
## 45    50   58     1.74
## 46    25   97     1.78
## 47    31   75     1.49
## 48    26   49     1.75
## 49    60  100     1.45
## 50    28   41     1.70
## 51    52   96     1.59
## 52    57   60     1.96
## 53    65   44     1.94
## 54    21  100     1.97
## 55    57   45     1.72
## 56    60   55     1.70
## 57    53   90     1.66
## 58    45   61     1.71
## 59    27   65     2.02
## 60    53   83     1.88
## 61    61   51     2.01
## 62    59   41     1.76
## 63    43   57     1.51
## 64    52   81     1.84
## 65    50   82     1.54
## 66    22   41     1.88
## 67    58   52     1.58
## 68    52   92     1.66
## 69    38   51     1.80
## 70    24   51     1.49
## 71    51   88     1.40
## 72    51   91     1.88
## 73    65   52     1.53
## 74    38   67     1.56
## 75    53   90     1.80
## 76    17   60     1.83
## 77    34   40     1.55
## 78    24   67     1.43
## 79    29   48     1.57
## 80    58   50     1.90
## 81    19   58     1.47
## 82    33   73     1.62
## 83    24   43     1.59
## 84    30   49     1.60
## 85    58   86     1.83
## 86    29   51     1.54
## 87    20   99     1.77
## 88    54   49     1.79
## 89    32   90     1.88
## 90    29   58     1.65
## 91    49   65     1.83
## 92    63   49     1.84
## 93    33  100     1.48
## 94    57   54     1.46
## 95    46   83     1.47
## 96    33  100     1.72
## 97    16   45     1.50
## 98    33   51     1.70
## 99    26   51     1.76
## 100   62   84     1.79

3. La media.(mean)

  1. edad
  2. peso
  3. estatura
mediaEdad<- mean(personas$edad)
mediaPeso <- mean(personas$peso)
mediaEstatura <- mean(personas$Estatura)


mediaEdad
## [1] 40.45
mediaPeso
## [1] 68.54
mediaEstatura
## [1] 1.7015

4. La mediana.

  1. edad
  2. peso
  3. estatura
medianaEdad <- median(personas$edad)
medianaPeso <- median(personas$peso)
medianaEstatura <- median(personas$Estatura)


medianaEdad
## [1] 40
medianaPeso
## [1] 65
mediaEstatura
## [1] 1.7015

5. La moda.

  1. edad
  2. peso
  3. estatura
modaEdad <- sort(table(personas$edad), decreasing = TRUE)
modaPeso <- sort(table(personas$peso), decreasing = TRUE)
modaEstatura <- sort(table(personas$Estatura), decreasing = TRUE)

moda <- modaEdad[1]
moda2 <- modaPeso[1]
moda3 <- modaEstatura[1]


modaEdad
## 
## 26 53 15 33 38 50 52 58 24 29 32 51 55 57 65 17 20 22 23 25 27 28 30 43 45 46 
##  5  5  4  4  4  4  4  4  3  3  3  3  3  3  3  2  2  2  2  2  2  2  2  2  2  2 
## 49 54 60 62 16 19 21 31 34 36 37 39 41 48 56 59 61 63 64 
##  2  2  2  2  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
cat("La moda de edad es :", names(moda), " con ", modaEdad[1])
## La moda de edad es : 26  con  5
modaPeso
## 
##  51 100  90  45  49  52  41  58  65  88  96  42  43  50  54  55  57  60  67  73 
##   8   6   5   4   4   4   3   3   3   3   3   2   2   2   2   2   2   2   2   2 
##  76  77  79  83  86  92  93  40  44  46  48  53  59  61  62  69  71  72  75  80 
##   2   2   2   2   2   2   2   1   1   1   1   1   1   1   1   1   1   1   1   1 
##  81  82  84  87  91  95  97  98  99 
##   1   1   1   1   1   1   1   1   1
cat("La moda de peso es :", names(moda2), " con ", modaPeso[1])
## La moda de peso es : 51  con  8
modaEstatura
## 
## 1.74 1.47  1.7 1.83 1.88 1.54 1.72 1.76  1.9 1.97 1.41 1.43 1.49  1.5 1.51 1.53 
##    5    4    4    4    4    3    3    3    3    3    2    2    2    2    2    2 
## 1.55 1.58 1.59  1.6 1.62 1.65 1.66 1.71 1.73 1.75 1.78 1.79  1.8 1.84 1.87 1.95 
##    2    2    2    2    2    2    2    2    2    2    2    2    2    2    2    2 
##  1.4 1.42 1.45 1.46 1.48 1.52 1.56 1.57 1.68 1.69 1.77 1.85 1.86 1.92 1.94 1.96 
##    1    1    1    1    1    1    1    1    1    1    1    1    1    1    1    1 
## 1.98 2.01 2.02 2.04 
##    1    1    1    1
cat("La moda de Estatura es :", names(moda3), " con ", modaEstatura[1])
## La moda de Estatura es : 1.74  con  5

6. Visualizar datos.

  1. Utilizar la librería ggplot2
ggplot(data = personas,aes(x = Edad)) + geom_bar()

7. Interpretar y comunicar datos

ggplot(data = personas, aes(x = Edad)) + geom_histogram(bins = 30)

7.1 otro forma de histograma

ggplot(personas, aes(x=Edad))+
  geom_histogram(aes(fill=..count..), bins = 20, color="white")+
  geom_vline(aes(xintercept=mean(edad)), color="red")+
  geom_vline(aes(xintercept=median(edad)), color="darkgreen")

7.2 otra, otra forma de hacer histograma

ggplot(aes(x = Edad), data = personas) +
 geom_histogram(color = 'green',
                fill = 'green',
                alpha = 0.2) +
 labs(title = "Histograma de Edad") +
  geom_vline(aes(xintercept = median(Edad),
                  color = "mediana"),
              linetype = "dashed",
              size = 1) +
   geom_vline(aes(xintercept = mean(Edad),
                  color = "media"),
              linetype = "dashed",
              size = 1) +
  geom_vline(
     aes(xintercept = moda[1],
         color = "moda"),
     linetype = "dashed",
     size = 1
   )
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

8 interpretacion