Objetivo

Determinar, interpretar y visualizar medidas de tendencia central de un conjunto de datos de edades, sueldos y calificaciones respectivamente.

Descripción

Desarrollo

Para cada uno de los tres conjuntos de datos se siembra una semilla para generar datos aleatorios.

set.seed(2021)

1. Edades

Muestra de edades

Se genera una muestra del contexto edades a través de la función sample(), indicando un rango de 18 a 65 años, un total de 50 números, habilitando la posibilidad de que se repitan entre sí.

edades=sample(18:65, 50, replace=TRUE)
edades
##  [1] 24 55 63 56 29 23 55 55 63 22 64 56 58 40 29 35 20 63 57 43 53 54 39 48 65
## [26] 51 36 21 39 22 26 55 35 60 23 39 23 32 51 39 33 32 41 34 55 54 37 21 47 25

Se ordenan los datos, con la finalidad de que su visualización resulte más agradable, esto con la función sort().

sort(edades)
##  [1] 20 21 21 22 22 23 23 23 24 25 26 29 29 32 32 33 34 35 35 36 37 39 39 39 39
## [26] 40 41 43 47 48 51 51 53 54 54 55 55 55 55 55 56 56 57 58 60 63 63 63 64 65

Cálculo de la Media y la Mediana

La media (promedio) se determina mediante la función mean() y la mediana (elemento ubicado exactamente a la mitad del conjunto de datos ordenados de forma ascendente), con la función median()

media.edades=mean(edades)
media.edades
## [1] 42
mediana.edades=median(edades)
mediana.edades
## [1] 39.5

Cuando el valor de la media y la mediana son iguales, la distribución de los datos es simétrica. Si el valor de la media es mayor que el de la mediana, la distribución es asimétrica con un sesgo positivo a la derecha; por el contrario, si el valor de la media es menor que la mediana, entonces la distribución es asimétrica con un sesgo negativo a la izquierda.

Obtención de la Moda

Por moda se entiende el valor con mayor frecuencia dentro de un conjunto de datos. Para determinarla es posible emplear la función table(), la cual especifica la frecuencia de cada valor del conjunto de datos; sin embargo también es posible utilizar la función mfv(), del paquete modeest.

Para lo anterior se carga la librería o paquete “modest”, con la función para instalarle install.packages(“modeest”).

library(modeest)
moda.edades=mfv(edades)
moda.edades
## [1] 55

Con la función table() se encuentra la frecuencia de cada valor del conjunto de datos.

frecuencias.edades=table(edades)
frecuencias.edades
## edades
## 20 21 22 23 24 25 26 29 32 33 34 35 36 37 39 40 41 43 47 48 51 53 54 55 56 57 
##  1  2  2  3  1  1  1  2  2  1  1  2  1  1  4  1  1  1  1  1  2  1  2  5  2  1 
## 58 60 63 64 65 
##  1  1  3  1  1

Valores Máximos y Mínimos

Con las funciones max() y min() se determinan los valores máximos y mínimos.

max.edades=max(edades)
max.edades
## [1] 65
min.edades=min(edades)
min.edades
## [1] 20

Rango

El rango se delimita por los elementos entre el valor máximo y el mínimo, para obtenerlo se emplea la función range(). El intervalo es el número de elementos que se encuentran entre ambos valores, y se consigue restando el máximo menos el mínimo.

rango.edades=range(edades)
rango.edades
## [1] 20 65
intervalo.edades=rango.edades[2]-rango.edades[1]
intervalo.edades
## [1] 45

Cuartiles

Los cuartiles (medidas de localización dentro de un conjunto de datos que sirven para interpretar cuántos datos están por encima y por debajo de cada cuartil), se determinan mediante la función quiantile().

El cuartil al 50% debe ser igual a la mediana.

cuartiles.edades=quantile(edades, c(0.25, 0.50, 0.75))
cuartiles.edades
##   25%   50%   75% 
## 29.75 39.50 55.00

Histograma

Un histograma refleja la distribución de los datos de un conjunto.

hist(edades, main="Histograma de Edades", xlab="Edades", ylab="Frecuencia")

Boxplot

El diagrama de bigotes o boxplot, representa los valores la mediana con línea en medio, los valores de los cuartiles y los extremos mínimo y máximo de un conjunto de datos. Refleja la cantidad de datos (el cuadro) que están por encima o por debajo de la media o cuartiles.

boxplot(edades, horizontal = TRUE, main="Edades")

Resumen

La función summary() genera los estadísticos descriptivos básicos de un conjunto de datos.

resumen.edades=summary(edades)
resumen.edades
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   20.00   29.75   39.50   42.00   55.00   65.00

2. Sueldos

Muestra de sueldos

Se crea un conjunto de datos de sueldos de un grupo de 500 empleados, de un rango de 10000 a 50000 pesos, habilitando su repetición entre sí. Se visualizan los primeros 10 de éstos, a modo de ejemplo, empleando la función head()

sueldos=sample(10000:50000, 500, replace=TRUE)
head(sueldos, 10)
##  [1] 13138 39816 28942 36778 24243 36062 44319 28731 25386 38428

Cálculo de la Media y la Mediana

Se emplean de misma forma las funciones mean() y median(), ahora para el conjunto de datos sueldos.

media.sueldos=mean(sueldos)
media.sueldos
## [1] 29444.72
mediana.sueldos=median(sueldos)
mediana.sueldos
## [1] 29630

Obtención de la Moda

library(modeest)
moda.sueldos=mfv(sueldos)
moda.sueldos
## [1] 26134 36746 40216 40794
frecuencias.sueldos=table(sueldos)
frecuencias.sueldos
## sueldos
## 10076 10112 10261 10511 10534 10678 10697 10808 10848 10872 10892 11020 11200 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 11326 11330 11339 11346 11440 11469 11559 11733 11845 11909 11922 11928 11933 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 11946 12013 12030 12191 12226 12232 12245 12290 12299 12322 12367 12479 12528 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 12611 12646 12678 12698 12876 12899 12936 12993 13009 13029 13099 13132 13138 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 13176 13298 13395 13400 13478 13497 13549 13662 13691 13720 13735 13829 13855 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 13907 14042 14068 14172 14297 14324 14418 14420 14584 14650 14658 14706 14761 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 15002 15014 15065 15101 15240 15269 15271 15359 15365 15447 15534 15613 15675 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 15770 16028 16394 16454 16549 16568 16604 16631 16683 16694 16872 17031 17072 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 17122 17517 17542 17643 17695 17723 17735 17818 17854 18016 18028 18042 18076 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 18100 18161 18201 18202 18306 18336 18343 18541 19237 19454 19744 19770 19880 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 19883 19941 19956 19957 20548 20629 20688 20762 20855 20903 20997 21059 21080 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 21137 21209 21248 21254 21291 21317 21475 21748 21761 21812 21878 21896 22111 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 22126 22153 22186 22237 22248 22378 22414 22586 22592 22635 22859 23013 23083 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 23170 23219 23345 23396 23403 23506 23522 23538 23565 23613 23674 23722 23728 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 23770 23781 23800 23936 23988 24031 24048 24205 24243 24440 24495 24637 24692 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 24863 24935 25051 25073 25196 25332 25386 25388 25524 25618 25860 25874 25920 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 26015 26134 26157 26182 26207 26286 26616 26672 26723 26914 26918 26989 27007 
##     1     2     1     1     1     1     1     1     1     1     1     1     1 
## 27053 27148 27213 27221 27251 27327 27476 27526 27536 27598 27850 27920 28091 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 28103 28356 28416 28451 28585 28731 28772 28831 28885 28888 28942 29195 29259 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 29394 29622 29638 29660 29714 29748 29909 29937 30005 30008 30085 30103 30192 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 30413 30678 30690 30716 30741 30764 30970 30983 31150 31181 31502 31515 31601 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 31612 31617 31654 31671 31699 31839 32004 32081 32148 32249 32285 32427 32466 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 32517 32570 32600 32681 32687 32705 32805 32843 32958 33055 33416 33505 33555 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 33660 33667 33958 34083 34175 34250 34456 34534 34592 34602 34664 34673 34801 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 35007 35152 35248 35450 35649 35728 36062 36177 36188 36225 36430 36518 36519 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 36534 36567 36569 36693 36721 36746 36770 36778 36795 36810 37039 37098 37234 
##     1     1     1     1     1     2     1     1     1     1     1     1     1 
## 37385 37574 37628 37636 37711 37849 37916 37927 37994 38026 38027 38040 38060 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 38070 38091 38153 38169 38187 38291 38376 38428 38450 38569 38619 38858 38954 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 39021 39115 39120 39227 39322 39372 39381 39455 39476 39480 39490 39687 39749 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 39816 39837 40066 40144 40216 40277 40411 40575 40600 40614 40735 40762 40768 
##     1     1     1     1     2     1     1     1     1     1     1     1     1 
## 40789 40794 40843 40882 41024 41059 41248 41307 41388 41407 41483 41512 41527 
##     1     2     1     1     1     1     1     1     1     1     1     1     1 
## 41574 41651 41700 41847 41880 41952 42089 42152 42190 42207 42221 42290 42408 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 42412 42512 42561 42681 42851 42951 43235 43238 43479 43910 44155 44319 44334 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 44403 44560 44569 44576 44589 44601 44748 44980 44984 45060 45128 45237 45358 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 45377 45395 45449 45466 45561 45631 45688 45788 45803 45954 46072 46080 46084 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 46109 46228 46489 46577 46609 46692 46735 46742 46781 47233 47236 47299 47481 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 47501 47530 47557 47614 47801 47916 47959 48020 48142 48174 48292 48462 48611 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 48642 48656 48700 48769 48830 49129 49241 49428 49480 49481 49492 49549 49591 
##     1     1     1     1     1     1     1     1     1     1     1     1     1 
## 49622 49754 
##     1     1

Se detona que son solamente 4 los casos en los cuales se repiten únicamente 2 veces el mismo sueldo, todos los demás no aparecen más de una vez; por ellos es que en el apartado de la moda se definen 4 elementos y no uno solo.

Valores Máximos y Mínimos

max.sueldos=max(sueldos)
max.sueldos
## [1] 49754
min.sueldos=min(sueldos)
min.sueldos
## [1] 10076

Se determina que el sueldo menor trata de 10076 pesos, y el mayor es de 49754.

Rango

rango.sueldos=range(sueldos)
rango.sueldos
## [1] 10076 49754
intervalo.sueldos=rango.sueldos[2]-rango.sueldos[1]
intervalo.sueldos
## [1] 39678

El rango, al igual que en el anterior apartado, va de 10076 a 47954, abarcando un intervalo de 39678 elementos entre ambos.

Cuartiles

cuartiles.sueldos=quantile(sueldos, c(0.25, 0.50, 0.75))
cuartiles.sueldos
##   25%   50%   75% 
## 19063 29630 39477

Histograma

Un histograma refleja la distribución de los datos de un conjunto.

hist(sueldos, main="Histograma de Sueldos", xlab="Sueldos", ylab="Frecuencia")

Boxplot

boxplot(sueldos, horizontal = TRUE, main="Sueldos")

Resumen

resumen.sueldos=summary(sueldos)
resumen.sueldos
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   10076   19063   29630   29445   39477   49754

3. Calificaciones

Muestra de calificaciones

Se genera una muestra de elementos del contexto de calificaciones de 100 estudiantes del ITD, de un rango de entre 70 y 100. Se muestra los 10 primeros elementos.

calif=sample(70:100, 100, replace=TRUE)
head(calif, 10)
##  [1] 99 90 83 80 71 75 71 94 72 95

Cálculo de la Media y la Mediana

Se emplean de misma forma las funciones mean() y median(), ahora para el conjunto de datos de calificaciones.

media.calif=mean(calif)
media.calif
## [1] 85.31
mediana.calif=median(calif)
mediana.calif
## [1] 85

Obtención de la Moda

library(modeest)
moda.calif=mfv(calif)
moda.calif
## [1] 100
frecuencias.calif=table(calif)
frecuencias.calif
## calif
##  70  71  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86  88  89  90 
##   3   4   4   5   2   4   2   4   1   1   2   4   7   2   3   5   3   2   5   5 
##  91  93  94  95  96  97  98  99 100 
##   3   5   4   1   1   1   4   5   8

Se detona por un total de 8 apariciones que la calificación perfecta es la de mayor frecuencia en este conjunto de datos, y es por tanto el equivalente a la moda.

Valores Máximos y Mínimos

max.calif=max(calif)
max.calif
## [1] 100
min.calif=min(calif)
min.calif
## [1] 70

Como se refirió durante la generación de la muestra, el rango abarcaría un máximo de 100 y un mínimo de 70, y en este caso la selección aleatoria consideró estos valores.

Rango

rango.calif=range(calif)
rango.calif
## [1]  70 100
intervalo.calif=rango.calif[2]-rango.calif[1]
intervalo.calif
## [1] 30

Se obtiene un rango de 70 a 100

Cuartiles

cuartiles.calif=quantile(calif, c(0.25, 0.50, 0.75))
cuartiles.calif
## 25% 50% 75% 
##  77  85  93

Histograma

Un histograma refleja la distribución de los datos de un conjunto.

hist(calif, main="Histograma de Calificaciones", xlab="Calificaciones", ylab="Frecuencia")

Boxplot

boxplot(calif, horizontal = TRUE, main="Calificaciones")

Resumen

resumen.calif=summary(calif)
resumen.calif
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   70.00   77.00   85.00   85.31   93.00  100.00

Interpretación

A partir de los resultados obtenidos, se concluye lo siguiente:

Cada herramienta es sumamente útil y simplifica mucho la labor de quien las emplea. Si la interpretación es el arte de la estadística, las herramientas como estas son las musas que la inspiran.