1 Cómo usar este material en clase

  • Objetivo: comparar varianzas (Prueba F) y medias (Prueba Z, varianzas conocidas) con gráficos e interpretaciones listas para explicar.
  • Sugerencia didáctica: lea el Marco teórico de cada ejercicio, ejecute el Script paso a paso (que queda visible arriba de cada gráfico) y cierre con la Conclusión.
  • Reproducibilidad: todo está en un solo .Rmd, pensado para subir a RPubs.

2 Ejercicio 7 — Comparación de varianzas (Prueba F)

2.1 Marco teórico (resumen)

Queremos contrastar si la empresa 2 tiene mayor variabilidad que la empresa 1. Sea \(\sigma_1^2\) y \(\sigma_2^2\) las varianzas poblacionales.

  • Hipótesis (cola derecha):
    \(\;H_0: \sigma_2^2 \le \sigma_1^2\) vs. \(H_1: \sigma_2^2 > \sigma_1^2\).
  • Estadístico: \(F = \dfrac{S_2^2}{S_1^2} \sim F(\,\nu_1=n_2-1,\;\nu_2=n_1-1\,)\) bajo \(H_0\).
  • Regla de decisión (nivel \(\alpha\)): rechazar \(H_0\) si \(F > F_{1-\alpha;\,\nu_1,\nu_2}\).

2.2 Script paso a paso

# ---- Datos ----
n1 <- 30; n2 <- 50
s1_2 <- 0.0005; s2_2 <- 0.0006
alpha <- 0.05

# ---- Cálculos ----
F_calc <- s2_2 / s1_2
gl1 <- n2 - 1        # grados de libertad numerador
gl2 <- n1 - 1        # grados de libertad denominador
F_crit <- qf(1 - alpha, df1 = gl1, df2 = gl2)
p_val <- 1 - pf(F_calc, df1 = gl1, df2 = gl2)

sprintf("F = %.3f, gl1=%d, gl2=%d, Fcrit=%.3f, p=%.5f", F_calc, gl1, gl2, F_crit, p_val)
## [1] "F = 1.200, gl1=49, gl2=29, Fcrit=1.777, p=0.30375"
# ---- Gráfico de la F y región crítica ----
library(ggplot2)
x <- seq(0, max(3, F_calc + 0.5), by = 0.01)
dens_f <- data.frame(x = x, y = df(x, df1 = gl1, df2 = gl2))

ggplot(dens_f, aes(x, y)) +
  geom_line() +
  geom_area(data = subset(dens_f, x > F_crit), aes(x, y), alpha = 0.3) +
  geom_vline(xintercept = F_calc, linetype = 2) +
  labs(title = "Prueba F — Comparación de varianzas",
       subtitle = paste0("Fcalc=", round(F_calc,3), " | Fcrit=", round(F_crit,3),
                         " | p=", formatC(p_val, digits = 4, format = 'f')),
       x = "F", y = "Densidad") +
  theme_minimal(base_size = 12)

2.3 Conclusión

if (F_calc > F_crit) {
  cat("**Decisión:** Rechazar H0.

**Interpretación:** Hay evidencia de que la empresa 2 presenta **mayor variabilidad** que la empresa 1 al 5%.")
} else {
  cat("**Decisión:** No rechazar H0.

**Interpretación:** No hay evidencia suficiente para afirmar que la empresa 2 tenga **mayor variabilidad** al 5%.")
}

Decisión: No rechazar H0.

Interpretación: No hay evidencia suficiente para afirmar que la empresa 2 tenga mayor variabilidad al 5%.


3 Ejercicio 8 — Diferencia de medias (muestras independientes, varianzas conocidas)

3.1 Marco teórico (resumen)

Comparamos \(\mu_1 - \mu_2\) con un umbral de 10 (psi).
- Hipótesis (cola izquierda): \(H_0: \mu_1 - \mu_2 \ge 10\) vs. \(H_1: \mu_1 - \mu_2 < 10\). - Estadístico: \[ Z = \frac{(\bar X_1 - \bar X_2) - 10}{\sqrt{\sigma_1^2/n_1 + \sigma_2^2/n_2}}\;\sim\;\mathcal N(0,1)\;\text{ si }H_0. \] - Regla (nivel \(\alpha\)): rechazar \(H_0\) si \(Z < z_{\alpha}\) (cola izquierda).

3.2 Script paso a paso

# ---- Datos ----
n1 <- 37; n2 <- 42
x1 <- 162.5; x2 <- 155
sigma1 <- 1; sigma2 <- 1
alpha <- 0.05

# ---- Cálculos ----
z_calc <- ((x1 - x2) - 10) / sqrt(sigma1^2/n1 + sigma2^2/n2)
z_crit <- qnorm(alpha)   # cola izquierda
p_val <- pnorm(z_calc)

sprintf("Z = %.3f, Zcrit = %.3f, p = %.5f", z_calc, z_crit, p_val)
## [1] "Z = -11.088, Zcrit = -1.645, p = 0.00000"
# ---- Gráfico Z y región crítica (cola izq.) ----
x <- seq(min(-4, z_calc - 1), max(3, z_calc + 1), by = 0.01)
dens <- data.frame(x = x, y = dnorm(x))

ggplot(dens, aes(x, y)) +
  geom_line() +
  geom_area(data = subset(dens, x < z_crit), aes(x, y), alpha = 0.3) +
  geom_vline(xintercept = z_calc, linetype = 2) +
  labs(title = "Prueba Z unilateral (cola izquierda)",
       subtitle = paste0("Zcalc=", round(z_calc,2), " | Zcrit=", round(z_crit,2),
                         " | p=", formatC(p_val, digits = 4, format = 'f')),
       x = "Z", y = "Densidad") +
  theme_minimal(base_size = 12)

3.3 Conclusión

if (z_calc < z_crit){
  cat("**Decisión:** Rechazar H0.

**Interpretación:** La diferencia media es **menor** a 10 psi ⇒ **NO** adoptar el plástico 1.")
} else {
  cat("**Decisión:** No rechazar H0.

**Interpretación:** El plástico 1 **cumple o supera** la diferencia de 10 psi.")
}

Decisión: Rechazar H0.

Interpretación: La diferencia media es menor a 10 psi ⇒ NO adoptar el plástico 1.


4 Ejercicio 9 — Comparación de riesgos (varianzas) con Prueba F

4.1 Marco teórico (resumen)

Comparamos el riesgo como varianza entre dos mercados A y B.
- Hipótesis (cola derecha): \(H_0: \sigma_B^2 \le \sigma_A^2\) vs. \(H_1: \sigma_B^2 > \sigma_A^2\). - Estadístico: \(F = \dfrac{S_B^2}{S_A^2} \sim F(\,\nu_1=n_B-1,\;\nu_2=n_A-1\,)\).

4.2 Script paso a paso

# ---- Datos ----
nA <- 21; nB <- 16
sA <- 0.25; sB <- 0.45
alpha <- 0.05

# ---- Cálculos ----
F_calc <- (sB^2) / (sA^2)
gl1 <- nB - 1; gl2 <- nA - 1
F_crit <- qf(1 - alpha, gl1, gl2)
p_val <- 1 - pf(F_calc, gl1, gl2)

sprintf("F=%.3f, gl1=%d, gl2=%d, Fcrit=%.3f, p=%.4f", F_calc, gl1, gl2, F_crit, p_val)
## [1] "F=3.240, gl1=15, gl2=20, Fcrit=2.203, p=0.0077"
# ---- Gráfico F y región crítica ----
x <- seq(0, max(6, F_calc + 0.5), by = 0.01)
dens_f <- data.frame(x = x, y = df(x, gl1, gl2))

ggplot(dens_f, aes(x, y)) +
  geom_line() +
  geom_area(data = subset(dens_f, x > F_crit), aes(x, y), alpha = 0.3) +
  geom_vline(xintercept = F_calc, linetype = 2) +
  labs(title = "Prueba F — Comparación de riesgos (mercados)",
       subtitle = paste0("Fcalc=", round(F_calc,3), " | Fcrit=", round(F_crit,3),
                         " | p=", formatC(p_val, digits = 4, format = 'f')),
       x = "F", y = "Densidad") +
  theme_minimal(base_size = 12)

4.3 Conclusión

if (F_calc > F_crit) {
  cat("**Decisión:** Rechazar H0.

**Interpretación:** El mercado B presenta **mayor riesgo (varianza)** que el A al 5%.")
} else {
  cat("**Decisión:** No rechazar H0.

**Interpretación:** No hay evidencia suficiente de mayor riesgo en el mercado B.")
}

Decisión: Rechazar H0.

Interpretación: El mercado B presenta mayor riesgo (varianza) que el A al 5%.


5 Apéndice — Plantilla para nuevos ejercicios

Copia este bloque y cambia datos/hipótesis según tu consigna.

# 1) Defina hipótesis (cola izq./der./bilateral) y alpha
alpha <- 0.05

# 2) Cargue datos y elija el test (F, t, Z, etc.)

# 3) Calcule el estadístico, el valor crítico y el p-valor

# 4) Grafique la distribución nula y la región crítica

# 5) Redacte conclusión en lenguaje claro

sessionInfo()
## R version 4.3.2 (2023-10-31 ucrt)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 11 x64 (build 26100)
## 
## Matrix products: default
## 
## 
## locale:
## [1] LC_COLLATE=Spanish_Argentina.utf8  LC_CTYPE=Spanish_Argentina.utf8   
## [3] LC_MONETARY=Spanish_Argentina.utf8 LC_NUMERIC=C                      
## [5] LC_TIME=Spanish_Argentina.utf8    
## 
## time zone: America/Buenos_Aires
## tzcode source: internal
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets  methods   base     
## 
## other attached packages:
## [1] ggplot2_4.0.0
## 
## loaded via a namespace (and not attached):
##  [1] vctrs_0.6.5        cli_3.6.2          knitr_1.50         rlang_1.1.6       
##  [5] xfun_0.52          generics_0.1.3     S7_0.2.0           jsonlite_1.8.8    
##  [9] labeling_0.4.3     glue_1.6.2         htmltools_0.5.8.1  sass_0.4.10       
## [13] fansi_1.0.6        scales_1.4.0       rmarkdown_2.29     grid_4.3.2        
## [17] tibble_3.2.1       evaluate_1.0.5     jquerylib_0.1.4    fastmap_1.2.0     
## [21] yaml_2.3.8         lifecycle_1.0.4    compiler_4.3.2     dplyr_1.1.4       
## [25] RColorBrewer_1.1-3 pkgconfig_2.0.3    rstudioapi_0.15.0  farver_2.1.1      
## [29] digest_0.6.33      R6_2.5.1           tidyselect_1.2.1   utf8_1.2.4        
## [33] pillar_1.9.0       magrittr_2.0.3     bslib_0.6.1        withr_3.0.2       
## [37] tools_4.3.2        gtable_0.3.6       cachem_1.1.0