Objetivo del análisis: Aplicar la prueba \(T^2\) de Hotelling para contrastar si el
vector de medias poblacionales de las variables wage,
educ y exper en la base wage1 es igual al
vector teórico \(\mu_0 = (6.3,\ 12,\
10)\), bajo un nivel de significancia \(\alpha = 0.05\).
El test de Hotelling generaliza la prueba \(t\) de Student al caso multivariante. Las hipótesis son:
\[H_0: \boldsymbol{\mu} = \boldsymbol{\mu}_0 = (6.3,\ 12,\ 10)^\top\]
\[H_1: \boldsymbol{\mu} \neq \boldsymbol{\mu}_0\]
con nivel de significancia \(\alpha = 0.05\).
El estadístico de Hotelling se define como:
\[T^2 = n\,(\bar{\mathbf{x}} - \boldsymbol{\mu}_0)^\top \mathbf{S}^{-1} (\bar{\mathbf{x}} - \boldsymbol{\mu}_0)\]
donde \(\bar{\mathbf{x}}\) es el vector de medias muestrales y \(\mathbf{S}\) es la matriz de covarianzas muestral.
Bajo \(H_0\), el estadístico se transforma:
\[F = \frac{n - p}{p\,(n-1)}\,T^2 \;\sim\; F_{p,\; n-p}\]
donde \(p\) es el número de variables y \(n\) el tamaño muestral.
data("wage1")
# Seleccionar las tres variables de interés
X <- na.omit(wage1[, c("wage", "educ", "exper")])
X <- as.matrix(X)
# Vista preliminar de los datos
head(X, 8)## wage educ exper
## 1 3.10 11 2
## 2 3.24 12 22
## 3 3.00 11 2
## 4 6.00 8 44
## 5 5.30 12 7
## 6 8.75 16 9
## 7 11.25 18 15
## 8 5.00 12 5
mu0 <- c(6.3, 12, 10) # Vector hipotético
alpha <- 0.05 # Nivel de significancia
cat("Vector hipotético µ0:", mu0, "\n")## Vector hipotético µ0: 6.3 12 10
## Nivel de significancia alpha: 0.05
Se utiliza HotellingsT2() del paquete
ICSNP como referencia para validar los resultados del
cálculo manual.
##
## Hotelling's one sample T2-test
##
## data: X
## T.2 = 97.466, df1 = 3, df2 = 523, p-value < 2.2e-16
## alternative hypothesis: true location is not equal to c(6.3,12,10)
n <- nrow(X) # Número de observaciones
p <- ncol(X) # Número de variables
cat("Observaciones (n):", n, "\n")## Observaciones (n): 526
## Variables (p): 3
## wage educ exper
## 5.8961 12.5627 17.0171
## wage educ exper
## wage 13.6389 4.1509 5.6591
## educ 4.1509 7.6675 -11.2573
## exper 5.6591 -11.2573 184.2035
## wage educ exper
## -0.4039 0.5627 7.0171
## T^2 = 293.5147
## F = 97.4655
## Grados de libertad: df1 = 3 | df2 = 523
pval <- pf(Fval, df1 = p, df2 = n - p, lower.tail = FALSE)
cat("p-valor =", format(pval, scientific = TRUE, digits = 4), "\n")## p-valor = 4.035e-50
decision <- ifelse(pval < alpha, "Se rechaza H0", "No se rechaza H0")
cat("Resultado:", decision, "\n")## Resultado: Se rechaza H0
## ==================================================
## RESUMEN — PRUEBA T^2 DE HOTELLING
## ==================================================
## Tamaño muestral (n) : 526
## Numero de variables (p) : 3
## Vector de medias muestrales:
## wage = 5.8961
## educ = 12.5627
## exper = 17.0171
## Vector hipotetico mu0:
## wage = 6.3 | educ = 12 | exper = 10
## Diferencia (xbar - mu0):
## wage = -0.4039
## educ = +0.5627
## exper = +7.0171
## --------------------------------------------------
## Estadistico T^2 = 293.5147
## Estadistico F = 97.4655
## p-valor = 4.03e-50
## alpha = 0.05
## --------------------------------------------------
## Decision: Se rechaza H0
## ==================================================
## Al nivel de significancia del 5%, se RECHAZA la hipotesis nula.
##
## Existe evidencia estadistica suficiente para afirmar que el vector
## de medias poblacionales de (wage, educ, exper) es significativamente
## diferente del vector teorico mu0 = (6.3, 12, 10).
##
## El p-valor ( 4.03e-50 ) confirma que esta diferencia no se debe al azar muestral.
Interpretación final: El valor del estadístico \(F\) y su \(p\)-valor permiten tomar una decisión
objetiva sobre la hipótesis planteada. Los resultados del cálculo manual
deben coincidir con los de la prueba automática
HotellingsT2(), lo que confirma la correcta aplicación del
procedimiento.