title: “Actividad 1 – Estadística Inferencial: Del Análisis muestral a la predicción Poblacional” author: “Francisco Javier Sánchez Sumano” date: “2026-05-05” output: html_document —

Introducción

En este documento se analiza el gasto semanal en café mediante pruebas de hipótesis en dos escenarios:

  1. Una población
  2. Comparación de dos poblaciones

Escenario 1: Una población

Problema

¿El gasto promedio semanal en café es mayor a $500?

Simulación de datos

set.seed(123)
n <- 1000
gasto_cafe <- rnorm(n, mean = 520, sd = 120)
data1 <- data.frame(gasto_cafe)

Estadísticos descriptivos

summary(data1$gasto_cafe)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   182.8   444.6   521.1   521.9   599.8   908.9
sd(data1$gasto_cafe)
## [1] 119.0034

Visualización

ggplot(data1, aes(x = gasto_cafe)) +
  geom_histogram(bins = 30, fill = "lightblue", color = "black") +
  geom_vline(xintercept = mean(data1$gasto_cafe), color = "red", linetype = "dashed") +
  labs(title = "Distribución del gasto en café",
       x = "Gasto semanal ($)",
       y = "Frecuencia") +
  theme_minimal()

Prueba de hipótesis

Hipótesis:

  • H0: μ ≤ 500
  • H1: μ > 500
prueba1 <- t.test(data1$gasto_cafe, mu = 500, alternative = "greater")
prueba1
## 
##  One Sample t-test
## 
## data:  data1$gasto_cafe
## t = 5.8289, df = 999, p-value = 3.762e-09
## alternative hypothesis: true mean is greater than 500
## 95 percent confidence interval:
##  515.7397      Inf
## sample estimates:
## mean of x 
##  521.9353

Conclusión

if(prueba1$p.value < 0.05){
  "Se rechaza H0: el gasto promedio es significativamente mayor a $500."
} else {
  "No se rechaza H0: no hay evidencia suficiente para afirmar que el gasto supera $500."
}
## [1] "Se rechaza H0: el gasto promedio es significativamente mayor a $500."

Escenario 2: Dos poblaciones

Problema

¿Existe diferencia en el gasto semanal en café entre estudiantes y oficinistas?

Simulación de datos

set.seed(456)
gasto_estudiantes <- rnorm(500, mean = 200, sd = 60)
gasto_oficinistas <- rnorm(500, mean = 350, sd = 70)

data2 <- data.frame(
  grupo = c(rep("Estudiantes", 500), rep("Oficinistas", 500)),
  gasto = c(gasto_estudiantes, gasto_oficinistas)
)

Estadísticos descriptivos

data2 %>%
  group_by(grupo) %>%
  summarise(
    media = mean(gasto),
    desviacion = sd(gasto)
  )
## # A tibble: 2 × 3
##   grupo       media desviacion
##   <chr>       <dbl>      <dbl>
## 1 Estudiantes  206.       58.3
## 2 Oficinistas  351.       69.2

Visualización

ggplot(data2, aes(x = grupo, y = gasto, fill = grupo)) +
  geom_boxplot() +
  labs(title = "Comparación de gasto en café",
       x = "Grupo",
       y = "Gasto semanal ($)") +
  theme_minimal()

Prueba de hipótesis

Hipótesis:

  • H0: μ1 = μ2
  • H1: μ1 ≠ μ2
prueba2 <- t.test(gasto ~ grupo, data = data2)
prueba2
## 
##  Welch Two Sample t-test
## 
## data:  gasto by grupo
## t = -35.858, df = 969.89, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group Estudiantes and group Oficinistas is not equal to 0
## 95 percent confidence interval:
##  -153.0927 -137.2054
## sample estimates:
## mean in group Estudiantes mean in group Oficinistas 
##                   205.889                   351.038

Conclusión

if(prueba2$p.value < 0.05){
  "Se rechaza H0: existe diferencia significativa entre los grupos."
} else {
  "No se rechaza H0: no hay diferencia significativa entre los grupos."
}
## [1] "Se rechaza H0: existe diferencia significativa entre los grupos."