Medida de localización

Cargar librerias

library(readr)       # Por si acaso cargamos datos ...
library(ggplot2)     # Para visualizar
library(resumeRdesc) # Para estadísticos descriptivos

Cargar o Contruir datos

set.seed(2020)

n <- 100   # Total de observaciones
edades <- sample(18:65, n, replace = TRUE)
pesos <- sample(47:100, n, replace = TRUE)
estaturas <- sample(149:205, n, replace = TRUE) /100

personas <- data.frame(edades, pesos, estaturas)
names(personas) <- c("edad", "peso", "estatura")

personas

##     edad peso estatura
## 1     45   66     1.75
## 2     61   98     1.52
## 3     40   66     1.51
## 4     39   60     1.68
## 5     41   59     1.72
## 6     18   74     1.68
## 7     34   63     1.92
## 8     53   76     1.77
## 9     59   91     1.49
## 10    23   85     1.87
## 11    62   87     1.92
## 12    25   86     1.92
## 13    59   73     1.70
## 14    33   75     2.05
## 15    46   99     1.60
## 16    51   81     1.60
## 17    65   81     1.58
## 18    20   48     1.61
## 19    19   59     1.75
## 20    46   54     1.93
## 21    57   69     1.90
## 22    21   78     1.89
## 23    31   50     1.92
## 24    31   85     1.77
## 25    29   92     1.73
## 26    65   95     2.04
## 27    64   99     2.05
## 28    31   82     2.05
## 29    24   70     1.67
## 30    37   94     1.50
## 31    35   87     1.97
## 32    38   75     1.92
## 33    65   74     1.52
## 34    61  100     1.59
## 35    35   48     1.67
## 36    27   78     1.99
## 37    48   63     1.99
## 38    23   63     1.77
## 39    64   83     1.99
## 40    60   56     1.89
## 41    30   97     1.50
## 42    49   93     2.02
## 43    41   57     1.68
## 44    30   97     1.55
## 45    62   63     1.56
## 46    19   85     1.62
## 47    48   59     1.92
## 48    33   56     1.73
## 49    30   84     1.84
## 50    18   67     1.71
## 51    55   56     1.58
## 52    20   57     1.99
## 53    46   93     1.61
## 54    42   49     1.75
## 55    62   71     1.83
## 56    60   90     1.75
## 57    42   77     2.02
## 58    22   69     1.75
## 59    60   97     1.68
## 60    55   91     1.71
## 61    19   94     1.55
## 62    42   50     1.76
## 63    52   67     1.53
## 64    41   87     2.00
## 65    50   83     1.75
## 66    24   98     1.87
## 67    25   49     2.01
## 68    38   72     1.70
## 69    30  100     1.69
## 70    51   47     1.73
## 71    22   75     1.93
## 72    21   60     1.96
## 73    36   70     1.74
## 74    65   73     1.64
## 75    40   85     1.67
## 76    21   64     1.80
## 77    35   82     1.74
## 78    59   65     1.90
## 79    18   71     1.84
## 80    64   84     1.84
## 81    39   50     1.57
## 82    48   56     1.76
## 83    58   72     1.96
## 84    33   97     1.98
## 85    23   70     1.49
## 86    41   67     1.93
## 87    43   81     1.96
## 88    27   90     1.90
## 89    43   71     1.82
## 90    50   89     1.93
## 91    45   68     1.54
## 92    18   79     1.89
## 93    34   98     1.72
## 94    57   61     1.99
## 95    32   77     1.51
## 96    61   58     1.95
## 97    30   77     1.98
## 98    22   47     1.74
## 99    41   97     2.02
## 100   65   96     2.04

La media

media.edad <- sum(personas$edad) / n
media.edad

## [1] 40.72

media.edad <- mean(personas$edad)
media.edad

## [1] 40.72

La mediana

mediana.edad <- median(personas$edad)
mediana.edad

## [1] 40.5

orden.personas.edad <- sort(personas$edad)
posicion <- ceiling(n /2)

orden.personas.edad

##   [1] 18 18 18 18 19 19 19 20 20 21 21 21 22 22 22 23 23 23 24 24 25 25 27 27 29
##  [26] 30 30 30 30 30 31 31 31 32 33 33 33 34 34 35 35 35 36 37 38 38 39 39 40 40
##  [51] 41 41 41 41 41 42 42 42 43 43 45 45 46 46 46 48 48 48 49 50 50 51 51 52 53
##  [76] 55 55 57 57 58 59 59 59 60 60 60 61 61 61 62 62 62 64 64 64 65 65 65 65 65

# La posicion 
cat("Valor de la posición ",posicion, " del conjunto de datos (Vector) edades es: ", orden.personas.edad[posicion])

## Valor de la posición  50  del conjunto de datos (Vector) edades es:  40

# La posición cuando son par
cat("Valor de la posición ",posicion + 1, " del conjunto de datos (Vector) edades es: ", orden.personas.edad[posicion + 1])

## Valor de la posición  51  del conjunto de datos (Vector) edades es:  41

mediana.edad <- sum(orden.personas.edad[posicion], orden.personas.edad[posicion + 1]) / 2
mediana.edad

## [1] 40.5

La moda

frecuencia <- table(personas$edad)
frecuencia <- sort(frecuencia, decreasing = TRUE)
frecuencia

## 
## 30 41 65 18 19 21 22 23 31 33 35 42 46 48 59 60 61 62 64 20 24 25 27 34 38 39 
##  5  5  5  4  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  2  2  2  2  2  2  2 
## 40 43 45 50 51 55 57 29 32 36 37 49 52 53 58 
##  2  2  2  2  2  2  2  1  1  1  1  1  1  1  1

moda <- frecuencia[1]
moda

## 30 
##  5

cat("La moda de edad es: ", names(moda), " con ", frecuencia[1])

## La moda de edad es:  30  con  5

print("¿Es una sola moda, bimodal o multimodal ?")

## [1] "¿Es una sola moda, bimodal o multimodal ?"

library(resumeRdesc)

moda <- Mode(personas$edad)
moda

## [1] 30 41 65

Visualizar Datos

ggplot(data = personas, aes(x = edad)) +
  geom_bar()

ggplot(data = personas, aes(x = edad)) +
  geom_histogram(bins = 30)

ggplot(personas, aes(x=edad)) + 
  geom_histogram(aes(fill=..count..), bins=20, color="black") +
  geom_vline(aes(xintercept=mean(edad)), color="orange") +
  geom_vline(aes(xintercept=median(edad)), color= "red")

ggplot(aes(x = edad), data = personas) +
 geom_histogram(color = 'blue',
                fill = 'blue',
                alpha = 0.2) +
 labs(title = "Histograma de Edad") +
  geom_vline(aes(xintercept = median(edad),
                  color = "mediana"),
              linetype = "dashed",
              size = 1) +
   geom_vline(aes(xintercept = mean(edad),
                  color = "media"),
              linetype = "dashed",
              size = 1) +
  geom_vline(
     aes(xintercept = moda[1],
         color = "moda"),
     linetype = "dashed",
     size = 1
   )

## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Interpretar y comunicar datos ‘’Al finalizar el caso, se da a saber que la MEDIA es de 40.72, la MEDIANA 40.5 y la MODA 30,5’’

Medida de localización

Alejandro Rosales Espinoza

27/9/2020