Se preguntó a mis familiares, ¿Cuál es tu estatura y peso? El objetivo es obtener información a partir de estos datos.
Los datos son:
# Estaturas
estatura<- c(159,175,178,180,186,170,167,184,181,172,185,155,157,179,182)
# Pesos
peso<- c(66,56,78,80,86,70,68,82,71,72,84,55,57,79,82)
#Opción 1
promedio_est = sum(estatura)/length(estatura)
promedio_est
## [1] 174
#Opción 2
mean(estatura)
## [1] 174
Interpretación: La estatura promedio de los familiares es de 174 cm, obtenida mediante dos métodos diferentes de cálculo, lo que respalda la consistencia de la medida.
#Opción 1
promedio_peso = sum(peso)/length(peso)
promedio_peso
## [1] 72.4
#Opción 2
mean(peso)
## [1] 72.4
Interpretación: El peso promedio de mis familiares es de 72.4kg, calculado tanto por la suma de los pesos dividida por el número de observaciones como por la función de media aritmética, asegurando precisión en la medida.
Representa el valor que, al ordenar todos los valores de menor a mayor, se encuentra al medio. En caso que el número de valores sea par, la mediana es el promedio de los dos valores de en medio. Cuando la variable es de tipo ordinal, la mediana es la mejor medida para representar la tendencia central.
median(estatura)
## [1] 178
El valor de la mediana es 178cm, indicando que el 50% de los familiares tienen una estatura igual o inferior a este valor, y el otro 50% tiene una estatura igual o superior.
median(peso)
## [1] 72
La mediana de los pesos es 72, señalando que el 50% de los familiares tienen un peso igual o inferior a este valor, y el otro 50% tiene un peso igual o superior.
La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas.
# Opción 1 (tabla)
table(estatura)
## estatura
## 155 157 159 167 170 172 175 178 179 180 181 182 184 185 186
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
# Opción 2
library(modeest)
mfv(estatura)
## [1] 155 157 159 167 170 172 175 178 179 180 181 182 184 185 186
# Opción 1 (tabla)
table(peso)
## peso
## 55 56 57 66 68 70 71 72 78 79 80 82 84 86
## 1 1 1 1 1 1 1 1 1 1 1 2 1 1
# Opción 2
library(modeest)
mfv(peso)
## [1] 82
En cuanto a los pesos, la moda es 82 kg, lo que sugiere que este valor es el más frecuente en la muestra.
La medida de variabilidad más sencilla es el Rango, para calcular esta medida hay que restar el valor máximo de los datos menos el valor menor.
Rango = Valor máximo – Valor mínimo
# Opción 1
rango = max(estatura) - min(estatura)
rango
## [1] 31
# Opción 2
range(estatura) #Ojo que se tiene que restar las salidas
## [1] 155 186
El rango de las estaturas es de 31 cm, proporcionando una indicación rápida de la dispersión total de los datos en este aspecto.
# Opción 1
rango = max(peso) - min(peso)
rango
## [1] 31
# Opción 2
range(peso) #Ojo que se tiene que restar las salidas
## [1] 55 86
En cuanto a los pesos, el rango es de 31 kg, mostrando la amplitud total de la variación en este atributo.
Representa en cuanto difiere el valor de cada observación (xi) a la media de los datos (cuadrada). A diferencia de las medidas anteriores, la varianza emplea todos los datos disponibles de la variable. Se recomienda su uso cuando se compara las variabilidades de dos o más variables.
\(s^2=\frac{\sum_{i=1}^n\left(x_i-\bar{x}\right)^2}{n-1}\) ## Estaturas
var(estatura)
## [1] 107.1429
var(peso)
## [1] 108.1143
Llamada también desviación típica, es la medida de dispersión más importante y de mayor uso en trabajos estadísticos. Un valor relativamente grande, significa, que la generosidad de los datos está alejados de la media y así recíprocamente. Es la raíz cuadrada positiva de la varianza.
# Opción 1
sqrt(var(estatura))
## [1] 10.35098
# Opción 2
sd(estatura)
## [1] 10.35098
# Opción 1
sqrt(var(peso))
## [1] 10.3978
# Opción 2
sd(peso)
## [1] 10.3978
El coeficiente de variación (CV) es una medida estadística que indica porcentualmente qué tan separados están los datos en relación con su promedio. Se obtiene al dividir la desviación estándar (S) entre el promedio (\(\bar{x}\))
\[ C V=\frac{S}{\bar{x}} \times 100 \]
• Si CV ≤ 30%, entonces la distribución es homogénea y la media es representativa. • Si CV > 30%, entonces la distribución no es homogénea y la media no es representativa. En este caso debemos tomar la mediana como medida representativa.
coef_var <- sd(estatura)/mean(estatura)*100
coef_var
## [1] 5.948841
Interpretación: El coeficiente de variación para las estaturas es aproximadamente 5.948841, indicando que la distribución es homogénea y la media es representativa, ya que el valor es menor al 30%.
coef_var2 <- sd(peso)/mean(peso)*100
coef_var2
## [1] 14.3616
library(psych)
## Registered S3 method overwritten by 'psych':
## method from
## plot.residuals rmutil
describe(estatura)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 15 174 10.35 178 174.54 8.9 155 186 31 -0.62 -1.13 2.67
library(psych)
describe(peso)
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 15 72.4 10.4 72 72.69 11.86 55 86 31 -0.41 -1.3 2.68