title: “Actividad 1 – Estadística Inferencial: Del Análisis muestral a la predicción Poblacional” author: “Francisco Javier Sánchez Sumano” date: “2026-05-05” output: html_document —
En este documento se analiza el gasto semanal en café mediante pruebas de hipótesis en dos escenarios:
¿El gasto promedio semanal en café es mayor a $500?
set.seed(123)
n <- 1000
gasto_cafe <- rnorm(n, mean = 520, sd = 120)
data1 <- data.frame(gasto_cafe)
summary(data1$gasto_cafe)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 182.8 444.6 521.1 521.9 599.8 908.9
sd(data1$gasto_cafe)
## [1] 119.0034
ggplot(data1, aes(x = gasto_cafe)) +
geom_histogram(bins = 30, fill = "lightblue", color = "black") +
geom_vline(xintercept = mean(data1$gasto_cafe), color = "red", linetype = "dashed") +
labs(title = "Distribución del gasto en café",
x = "Gasto semanal ($)",
y = "Frecuencia") +
theme_minimal()
Hipótesis:
prueba1 <- t.test(data1$gasto_cafe, mu = 500, alternative = "greater")
prueba1
##
## One Sample t-test
##
## data: data1$gasto_cafe
## t = 5.8289, df = 999, p-value = 3.762e-09
## alternative hypothesis: true mean is greater than 500
## 95 percent confidence interval:
## 515.7397 Inf
## sample estimates:
## mean of x
## 521.9353
if(prueba1$p.value < 0.05){
"Se rechaza H0: el gasto promedio es significativamente mayor a $500."
} else {
"No se rechaza H0: no hay evidencia suficiente para afirmar que el gasto supera $500."
}
## [1] "Se rechaza H0: el gasto promedio es significativamente mayor a $500."
¿Existe diferencia en el gasto semanal en café entre estudiantes y oficinistas?
set.seed(456)
gasto_estudiantes <- rnorm(500, mean = 200, sd = 60)
gasto_oficinistas <- rnorm(500, mean = 350, sd = 70)
data2 <- data.frame(
grupo = c(rep("Estudiantes", 500), rep("Oficinistas", 500)),
gasto = c(gasto_estudiantes, gasto_oficinistas)
)
data2 %>%
group_by(grupo) %>%
summarise(
media = mean(gasto),
desviacion = sd(gasto)
)
## # A tibble: 2 × 3
## grupo media desviacion
## <chr> <dbl> <dbl>
## 1 Estudiantes 206. 58.3
## 2 Oficinistas 351. 69.2
ggplot(data2, aes(x = grupo, y = gasto, fill = grupo)) +
geom_boxplot() +
labs(title = "Comparación de gasto en café",
x = "Grupo",
y = "Gasto semanal ($)") +
theme_minimal()
Hipótesis:
prueba2 <- t.test(gasto ~ grupo, data = data2)
prueba2
##
## Welch Two Sample t-test
##
## data: gasto by grupo
## t = -35.858, df = 969.89, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group Estudiantes and group Oficinistas is not equal to 0
## 95 percent confidence interval:
## -153.0927 -137.2054
## sample estimates:
## mean in group Estudiantes mean in group Oficinistas
## 205.889 351.038
if(prueba2$p.value < 0.05){
"Se rechaza H0: existe diferencia significativa entre los grupos."
} else {
"No se rechaza H0: no hay diferencia significativa entre los grupos."
}
## [1] "Se rechaza H0: existe diferencia significativa entre los grupos."