Medidas Estadísticas

Caso edades de estudiantes

Se Pregunto a los estudiantes del curso, ¿Cuántos años tienes?, El Objetivo es Obtener medidas estadisticas a partir de sus datos.

Los Datos Son:

edades <-c(18, 19, 18, 19, 18, 20, 19, 19, 20, 17, 18, 21, 21, 18)

Medidas Estadísticas de tendencia central

Media Aritmética

La media aritmetica (media o promedio) de un conjunto de valores de una variable es la suma de dichos valores dividida entre el número de valores. Se denota por \(\bar{x}\)

#Opción 1
promedio = sum(edades)/length(edades)
promedio
## [1] 18.92857
#Opción 2
mean(edades)
## [1] 18.92857

Interpretación: La edad promedio de los estudiantes del curso es: 18.92857

Mediana

median(edades)
## [1] 19

El Valor de la mediana es: 19

Interpretación : El 50% de los estudiantes del curso su edad máxima es: 19 Años. El Otro 50% (la mitad) su valor mínimo es 19 Años.

Moda

# Opción 1 (Tabla)
table(edades)
## edades
## 17 18 19 20 21 
##  1  5  4  2  2
#Opción 2
library(modeest)
mfv(edades)
## [1] 18

Ojo: Se Puedo Tener los siguientes resultados: Unimodal: una sola moda. Bimodal: Dos Modas. Multimodal: Más de dos modas Amodal: No Hay Valor más frecuente

Interpretación: Las edades más frecuentes (que más se repiten) son 18 y 19 años respectivamente.

MEDIDAS DE VARIABILIDAD O DISPERSIÓN

Rango

#Opción 1
rango = max(edades) - min(edades)
rango
## [1] 4
#Opción 2
range(edades) #Ojo que es tiene que restar las salidas
## [1] 17 21

Varianza

\(s^2=\frac{\sum_{i=1}^n\left(x_i-\bar{x}\right)^2}{n-1}\)

var(edades)
## [1] 1.456044

Desviación Estándar

#Opción 1
sqrt(var(edades))
## [1] 1.206666
#Opción 2
sd(edades)
## [1] 1.206666

Interpretación: La Variabilidad Promedio de los datos respecto a la media es: 1.206666.

Opción de Interpretación: Las edades de los estudiantes del curso se alejan de la media 1.206666 en Promedio.

Coeficiente de Variación

\[ C V=\frac{S}{\bar{x}} \times 100 \]

coef_var <- sd(edades)/mean(edades)*100
coef_var
## [1] 6.374842

Interpretación: Como el CV es 6.374842 < 30%, entonces la distribución de las edades es homogénea y la medida es representativa.

Otra forma de obtenerlo es:

# Con la función Summary
summary(edades)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   17.00   18.00   19.00   18.93   19.75   21.00

Con la función psych

## Con la función psych
library(psych)
describe(edades)