2022-12-28

Medidas de tendencia central

Media Aritmética:

La media es un promedio, y es el resultado de sumar todos los valores observados de la variable y dividirlos entre el número de observaciones. En estadística, es una de las medidas más usadas. Se identificará a través del simbolo: \(\overline{x}\)

Observemos el siguiente conjunto de datos que representan los pesos en Kilogramos (kgs) de un grupo de pacientes femeninas que asistieron a consulta general de un hospital del área metropolitana.

$pesos
 [1] 49 59 60 51 52 51 48 54 51 59 60 52 49 52 55 60 60 55 49 54 51 57 54 55 53
[26] 50 59 52 56 54

Procedamos manualmente con el ejemplo…

  # A tibble: 12 × 2
     pesos    fi
     <int> <int>
   1    48     1
   2    49     3
   3    50     1
   4    51     4
   5    52     4
   6    53     1
   7    54     4
   8    55     3
   9    56     1
  10    57     1
  11    59     3
  12    60     4

¿Como lo haríamos en R?

Comandos

Creando un data frame (data.frame):

df <- data.frame(pesos=c( ))

dentro de los parentesis vacíos que observamos en c( ) en el data frame de ejemplo y separados por comas se colocan los valores o elementos correspondientes a cada columna de datos que deseemos crear con sus respectivos nombres. c(elem1,elem2,elem3,…,elemN)

Calculando la media

Usando el comando mean( ) debes colocar dentro de los paréntesis el nombre que identifica a tú objeto, seguido del símbolo $ para que puedas escoger la columna de la variable que deseas procesar

Esta es la media de los pesos:

mean(df$pesos)
[1] 54.03333

Mediana:

Simbolizada por Md, es el valor medio de un sucesión de números ordenados.

Cuando la cantidad elementos (n) es impar, escogemos el valor que divide a la muestra en dos partes iguales, pero si (n) es par, escogemos los dos elementos centrales y calculamos su promedio.

Ejemplo:

Hallar la Mediana de {1,8,3,5,2,3,7} y de {8,2,1,3}

Moda:

Se define como el dato de máxima frecuencia observada. Un conjunto de datos puede no tener moda, ser unimodal, bimodal o multimodal.

Exprese la moda en el siguiente conjunto de datos: {1,2,2,2,3,4}

Script en R…

Usando la base de datos (df) recien creada tenemos:

# Comando para calcular la mediana
median(df$pesos)
## [1] 54
# Comando para obtener la moda
table(df$pesos)
## 
## 48 49 50 51 52 53 54 55 56 57 59 60 
##  1  3  1  4  4  1  4  3  1  1  3  4

Otra manera de poder encontrar la moda en una serie de datos es usando el siguiente comando:

library(modeest)

mlv(df$pesos)
## [1] 51 52 54 60