Objetivo del análisis: Aplicar la prueba \(T^2\) de Hotelling para contrastar si el vector de medias poblacionales de las variables wage, educ y exper en la base wage1 es igual al vector teórico \(\mu_0 = (6.3,\ 12,\ 10)\), bajo un nivel de significancia \(\alpha = 0.05\).


1 Marco Teórico

1.1 Hipótesis del contraste

El test de Hotelling generaliza la prueba \(t\) de Student al caso multivariante. Las hipótesis son:

\[H_0: \boldsymbol{\mu} = \boldsymbol{\mu}_0 = (6.3,\ 12,\ 10)^\top\]

\[H_1: \boldsymbol{\mu} \neq \boldsymbol{\mu}_0\]

con nivel de significancia \(\alpha = 0.05\).

1.2 Estadístico \(T^2\)

El estadístico de Hotelling se define como:

\[T^2 = n\,(\bar{\mathbf{x}} - \boldsymbol{\mu}_0)^\top \mathbf{S}^{-1} (\bar{\mathbf{x}} - \boldsymbol{\mu}_0)\]

donde \(\bar{\mathbf{x}}\) es el vector de medias muestrales y \(\mathbf{S}\) es la matriz de covarianzas muestral.

1.3 Transformación a distribución \(F\)

Bajo \(H_0\), el estadístico se transforma:

\[F = \frac{n - p}{p\,(n-1)}\,T^2 \;\sim\; F_{p,\; n-p}\]

donde \(p\) es el número de variables y \(n\) el tamaño muestral.


2 Preparación del Análisis

2.1 Carga de librerías

# Instalar si es necesario:
# install.packages("wooldridge")
# install.packages("ICSNP")

library(wooldridge)   # Base de datos wage1
library(ICSNP)        # Prueba T² de Hotelling automática

2.2 Carga y preparación de datos

data("wage1")

# Seleccionar las tres variables de interés
X <- na.omit(wage1[, c("wage", "educ", "exper")])
X <- as.matrix(X)

# Vista preliminar de los datos
head(X, 8)
##    wage educ exper
## 1  3.10   11     2
## 2  3.24   12    22
## 3  3.00   11     2
## 4  6.00    8    44
## 5  5.30   12     7
## 6  8.75   16     9
## 7 11.25   18    15
## 8  5.00   12     5

3 Especificación de la Hipótesis Nula

mu0   <- c(6.3, 12, 10)   # Vector hipotético
alpha <- 0.05              # Nivel de significancia

cat("Vector hipotético µ0:", mu0, "\n")
## Vector hipotético µ0: 6.3 12 10
cat("Nivel de significancia alpha:", alpha, "\n")
## Nivel de significancia alpha: 0.05

4 Prueba Automática (Referencia)

Se utiliza HotellingsT2() del paquete ICSNP como referencia para validar los resultados del cálculo manual.

HotellingsT2(X, mu = mu0)
## 
##  Hotelling's one sample T2-test
## 
## data:  X
## T.2 = 97.466, df1 = 3, df2 = 523, p-value < 2.2e-16
## alternative hypothesis: true location is not equal to c(6.3,12,10)

5 Cálculo Manual Paso a Paso

5.1 Dimensiones de la muestra

n <- nrow(X)   # Número de observaciones
p <- ncol(X)   # Número de variables

cat("Observaciones (n):", n, "\n")
## Observaciones (n): 526
cat("Variables      (p):", p, "\n")
## Variables      (p): 3

5.2 Vector de medias muestrales \(\bar{\mathbf{x}}\)

xbar <- colMeans(X)
round(xbar, 4)
##    wage    educ   exper 
##  5.8961 12.5627 17.0171

5.3 Matriz de covarianzas \(\mathbf{S}\)

S <- cov(X)
round(S, 4)
##          wage     educ    exper
## wage  13.6389   4.1509   5.6591
## educ   4.1509   7.6675 -11.2573
## exper  5.6591 -11.2573 184.2035

5.4 Diferencia \(\bar{\mathbf{x}} - \boldsymbol{\mu}_0\)

d <- xbar - mu0
round(d, 4)
##    wage    educ   exper 
## -0.4039  0.5627  7.0171

5.5 Inversa de la matriz de covarianzas \(\mathbf{S}^{-1}\)

Sinv <- solve(S)
round(Sinv, 6)
##            wage      educ     exper
## wage   0.094626 -0.060965 -0.006633
## educ  -0.060965  0.182554  0.013029
## exper -0.006633  0.013029  0.006429

6 Cálculo del Estadístico \(T^2\)

T2 <- as.numeric(n * t(d) %*% Sinv %*% d)
cat("T^2 =", round(T2, 4), "\n")
## T^2 = 293.5147

7 Transformación a Estadístico \(F\)

Fval <- (n - p) / (p * (n - 1)) * T2
cat("F   =", round(Fval, 4), "\n")
## F   = 97.4655
cat("Grados de libertad: df1 =", p, "| df2 =", n - p, "\n")
## Grados de libertad: df1 = 3 | df2 = 523

8 Cálculo del \(p\)-valor

pval <- pf(Fval, df1 = p, df2 = n - p, lower.tail = FALSE)
cat("p-valor =", format(pval, scientific = TRUE, digits = 4), "\n")
## p-valor = 4.035e-50

9 Decisión Estadística

decision <- ifelse(pval < alpha, "Se rechaza H0", "No se rechaza H0")
cat("Resultado:", decision, "\n")
## Resultado: Se rechaza H0

10 Resumen de Resultados

## ==================================================
##       RESUMEN — PRUEBA T^2 DE HOTELLING
## ==================================================
##   Tamaño muestral (n)       : 526
##   Numero de variables (p)   : 3
##   Vector de medias muestrales:
##     wage  = 5.8961
##     educ  = 12.5627
##     exper = 17.0171
##   Vector hipotetico mu0:
##     wage = 6.3  |  educ = 12  |  exper = 10
##   Diferencia (xbar - mu0):
##     wage  = -0.4039
##     educ  = +0.5627
##     exper = +7.0171
## --------------------------------------------------
##   Estadistico T^2 = 293.5147
##   Estadistico F   = 97.4655
##   p-valor         = 4.03e-50
##   alpha           = 0.05
## --------------------------------------------------
##   Decision: Se rechaza H0
## ==================================================

11 Conclusión

## Al nivel de significancia del 5%, se RECHAZA la hipotesis nula.
## 
##  Existe evidencia estadistica suficiente para afirmar que el vector
##  de medias poblacionales de (wage, educ, exper) es significativamente
##  diferente del vector teorico mu0 = (6.3, 12, 10).
## 
##  El p-valor ( 4.03e-50 ) confirma que esta diferencia no se debe al azar muestral.

Interpretación final: El valor del estadístico \(F\) y su \(p\)-valor permiten tomar una decisión objetiva sobre la hipótesis planteada. Los resultados del cálculo manual deben coincidir con los de la prueba automática HotellingsT2(), lo que confirma la correcta aplicación del procedimiento.