Medidas estadísticas

Se preguntó a mis familiares, ¿Cuál es tu estatura y peso? El objetivo es obtener información a partir de estos datos.

Los datos son:

# Estaturas
estatura<- c(159,175,178,180,186,170,167,184,181,172,185,155,157,179,182)

# Pesos
peso<- c(66,56,78,80,86,70,68,82,71,72,84,55,57,79,82)

Medidas estadísticas de tendencia central

Media aritmética

Estaturas

#Opción 1
promedio_est = sum(estatura)/length(estatura)
promedio_est
## [1] 174
#Opción 2
mean(estatura)
## [1] 174

Interpretación: La estatura promedio de los familiares es de 174 cm, obtenida mediante dos métodos diferentes de cálculo, lo que respalda la consistencia de la medida.

Pesos

#Opción 1
promedio_peso = sum(peso)/length(peso)
promedio_peso
## [1] 72.4
#Opción 2
mean(peso)
## [1] 72.4

Interpretación: El peso promedio de mis familiares es de 72.4kg, calculado tanto por la suma de los pesos dividida por el número de observaciones como por la función de media aritmética, asegurando precisión en la medida.

Mediana

Representa el valor que, al ordenar todos los valores de menor a mayor, se encuentra al medio. En caso que el número de valores sea par, la mediana es el promedio de los dos valores de en medio. Cuando la variable es de tipo ordinal, la mediana es la mejor medida para representar la tendencia central.

Estaturas

median(estatura)
## [1] 178

El valor de la mediana es 178cm, indicando que el 50% de los familiares tienen una estatura igual o inferior a este valor, y el otro 50% tiene una estatura igual o superior.

Pesos

median(peso)
## [1] 72

La mediana de los pesos es 72, señalando que el 50% de los familiares tienen un peso igual o inferior a este valor, y el otro 50% tiene un peso igual o superior.

Moda

La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas.

Estaturas

# Opción 1 (tabla)
table(estatura)
## estatura
## 155 157 159 167 170 172 175 178 179 180 181 182 184 185 186 
##   1   1   1   1   1   1   1   1   1   1   1   1   1   1   1
# Opción 2
library(modeest)
mfv(estatura)
##  [1] 155 157 159 167 170 172 175 178 179 180 181 182 184 185 186

Pesos

# Opción 1 (tabla)
table(peso)
## peso
## 55 56 57 66 68 70 71 72 78 79 80 82 84 86 
##  1  1  1  1  1  1  1  1  1  1  1  2  1  1
# Opción 2
library(modeest)
mfv(peso)
## [1] 82

En cuanto a los pesos, la moda es 82 kg, lo que sugiere que este valor es el más frecuente en la muestra.

MEDIDAS DE VARIABILIDAD O DISPERSIÓN

Rango

La medida de variabilidad más sencilla es el Rango, para calcular esta medida hay que restar el valor máximo de los datos menos el valor menor.

Rango = Valor máximo – Valor mínimo

Estaturas

# Opción 1
rango = max(estatura) - min(estatura)
rango
## [1] 31
# Opción 2
range(estatura) #Ojo que se tiene que restar las salidas
## [1] 155 186

El rango de las estaturas es de 31 cm, proporcionando una indicación rápida de la dispersión total de los datos en este aspecto.

Pesos

# Opción 1
rango = max(peso) - min(peso)
rango
## [1] 31
# Opción 2
range(peso) #Ojo que se tiene que restar las salidas
## [1] 55 86

En cuanto a los pesos, el rango es de 31 kg, mostrando la amplitud total de la variación en este atributo.

Varianza

Representa en cuanto difiere el valor de cada observación (xi) a la media de los datos (cuadrada). A diferencia de las medidas anteriores, la varianza emplea todos los datos disponibles de la variable. Se recomienda su uso cuando se compara las variabilidades de dos o más variables.

\(s^2=\frac{\sum_{i=1}^n\left(x_i-\bar{x}\right)^2}{n-1}\) ## Estaturas

var(estatura)
## [1] 107.1429

Pesos

var(peso)
## [1] 108.1143

Desviación estándar

Llamada también desviación típica, es la medida de dispersión más importante y de mayor uso en trabajos estadísticos. Un valor relativamente grande, significa, que la generosidad de los datos está alejados de la media y así recíprocamente. Es la raíz cuadrada positiva de la varianza.

Estaturas

# Opción 1
sqrt(var(estatura))
## [1] 10.35098
# Opción 2
sd(estatura)
## [1] 10.35098

Pesos

# Opción 1
sqrt(var(peso))
## [1] 10.3978
# Opción 2
sd(peso)
## [1] 10.3978

Coeficiente de variación

El coeficiente de variación (CV) es una medida estadística que indica porcentualmente qué tan separados están los datos en relación con su promedio. Se obtiene al dividir la desviación estándar (S) entre el promedio (\(\bar{x}\))

\[ C V=\frac{S}{\bar{x}} \times 100 \]

• Si CV ≤ 30%, entonces la distribución es homogénea y la media es representativa. • Si CV > 30%, entonces la distribución no es homogénea y la media no es representativa. En este caso debemos tomar la mediana como medida representativa.

Estaturas

coef_var <- sd(estatura)/mean(estatura)*100
coef_var
## [1] 5.948841

Interpretación: El coeficiente de variación para las estaturas es aproximadamente 5.948841, indicando que la distribución es homogénea y la media es representativa, ya que el valor es menor al 30%.

Pesos

coef_var2 <- sd(peso)/mean(peso)*100
coef_var2
## [1] 14.3616
library(psych)
## Registered S3 method overwritten by 'psych':
##   method         from  
##   plot.residuals rmutil
describe(estatura)
##    vars  n mean    sd median trimmed mad min max range  skew kurtosis   se
## X1    1 15  174 10.35    178  174.54 8.9 155 186    31 -0.62    -1.13 2.67
library(psych)
describe(peso)
##    vars  n mean   sd median trimmed   mad min max range  skew kurtosis   se
## X1    1 15 72.4 10.4     72   72.69 11.86  55  86    31 -0.41     -1.3 2.68