Parcial 3
b) Intervalo de confianza del 99%
cat("\nPUNTO 1 - b) Intervalo de confianza (99%) para diferencia de medias\n")
##
## PUNTO 1 - b) Intervalo de confianza (99%) para diferencia de medias
print(t_test$conf.int)
## [1] -3.939871 2.939871
## attr(,"conf.level")
## [1] 0.99
t_test <- t.test(sucursal_A, sucursal_B, var.equal = TRUE, conf.level = 0.99)
c) p-value
cat("\nPUNTO 1 - c) p-value:\n")
##
## PUNTO 1 - c) p-value:
print(t_test$p.value)
## [1] 0.6479016
cat("\nEstadístico t:", t_test$statistic, "\n")
##
## Estadístico t: -0.4723775
cat("Grados de libertad:", t_test$parameter, "\n")
## Grados de libertad: 9
cat("Valor p:", t_test$p.value, "\n")
## Valor p: 0.6479016
d Distribución normal- Decisión con α = 0.01
alpha <- 0.01
cat("\nNivel de significancia: α =", alpha, "\n")
##
## Nivel de significancia: α = 0.01
if (t_test$p.value < alpha) {
cat("→ Se rechaza H0\n")
} else {
cat("→ No se rechaza H0\n")
}
## → No se rechaza H0
5. Conclusión en contexto
cat("\nConclusión:\n")
##
## Conclusión:
if (t_test$p.value < alpha) {
cat("Hay evidencia significativa al 1% de que los tiempos promedio de entrega entre sucursales son diferentes.\n")
} else {
cat("No hay evidencia suficiente para afirmar que los tiempos promedio de entrega entre sucursales son diferentes.\n")
}
## No hay evidencia suficiente para afirmar que los tiempos promedio de entrega entre sucursales son diferentes.
2 punto - Relación de significancia
tabla <- matrix(c(
25, 15, 10, # Pequeño: Aéreo, Terrestre, Marítimo
15, 25, 20, # Mediano
10, 20, 30 # Grande
),
nrow = 3, byrow = TRUE)
rownames(tabla) <- c("Pequeño", "Mediano", "Grande")
colnames(tabla) <- c("Aéreo", "Terrestre", "Marítimo")
cat("🔹 Tabla de contingencia:\n")
## 🔹 Tabla de contingencia:
print(tabla)
## Aéreo Terrestre Marítimo
## Pequeño 25 15 10
## Mediano 15 25 20
## Grande 10 20 30
# Prueba de independencia (Chi-cuadrado)
cat("\n🔹 PUNTO 2: Prueba Chi-cuadrado de independencia\n")
##
## 🔹 PUNTO 2: Prueba Chi-cuadrado de independencia
# 1. Formular las hipótesis
cat("\nHipótesis:\n")
##
## Hipótesis:
cat("H0: El tipo de paquete es independiente del método de entrega\n")
## H0: El tipo de paquete es independiente del método de entrega
cat("H1: Existe una relación significativa entre el tipo de paquete y el método de entrega\n")
## H1: Existe una relación significativa entre el tipo de paquete y el método de entrega
# 2. Realizar la prueba
chi_test <- chisq.test(tabla)
# 3. Resultados
cat("\nEstadístico Chi-cuadrado:", chi_test$statistic, "\n")
##
## Estadístico Chi-cuadrado: 19.125
cat("Grados de libertad:", chi_test$parameter, "\n")
## Grados de libertad: 4
cat("Valor p:", chi_test$p.value, "\n")
## Valor p: 0.0007427211
# 4. Nivel de significancia
alpha <- 0.05
cat("\nNivel de significancia: α =", alpha, "\n")
##
## Nivel de significancia: α = 0.05
# 5. Decisión
if (chi_test$p.value < alpha) {
cat("→ Se rechaza H0\n")
} else {
cat("→ No se rechaza H0\n")
}
## → Se rechaza H0
# 6. Conclusión en contexto
cat("\nConclusión:\n")
##
## Conclusión:
if (chi_test$p.value < alpha) {
cat("Existe evidencia significativa de que el tipo de paquete está relacionado con el método de entrega.\n")
} else {
cat("No hay evidencia suficiente para afirmar que el tipo de paquete influya en el método de entrega.\n")
}
## Existe evidencia significativa de que el tipo de paquete está relacionado con el método de entrega.
3 punto - Correlación
# Datos conocidos
Y <- c(4, 3, 2, 1, 5) # Satisfacción
n <- length(Y)
sum_Y <- sum(Y) # ∑Y
sum_Y2 <- sum(Y^2) # ∑Y^2
sum_X <- 100 # ∑X
sum_X2 <- 2250 # ∑X^2
sum_XY <- 300 # ∑XY
# Derivados
mean_X <- sum_X / n
mean_Y <- sum_Y / n
# Calcular Sxx, Syy, Sxy
Sxx <- sum_X2 - (sum_X^2 / n)
Syy <- sum_Y2 - (sum_Y^2 / n)
Sxy <- sum_XY - (sum_X * sum_Y / n)
a) Correlación R y R^2
cat("🔹 PUNTO 3.a) Coeficientes de correlación\n")
## 🔹 PUNTO 3.a) Coeficientes de correlación
R <- Sxy / sqrt(Sxx * Syy)
R2 <- R^2
cat("Coeficiente de correlación (R):", round(R, 4), "\n")
## Coeficiente de correlación (R): 0
cat("Coeficiente de determinación (R^2):", round(R2, 4), "\n")
## Coeficiente de determinación (R^2): 0
if (abs(R) > 0.7) {
cat("→ Existe una correlación significativa y fuerte entre las variables.\n")
} else {
cat("→ La correlación no es fuerte o significativa.\n")
}
## → La correlación no es fuerte o significativa.
b) Modelo de regresión lineal
cat("\n🔹 PUNTO 3.b) Modelo de regresión lineal Y = B0 + B1*X\n")
##
## 🔹 PUNTO 3.b) Modelo de regresión lineal Y = B0 + B1*X
B1 <- Sxy / Sxx
B0 <- mean_Y - B1 * mean_X
cat("Pendiente (B1):", round(B1, 4), "\n")
## Pendiente (B1): 0
cat("Intercepto (B0):", round(B0, 4), "\n")
## Intercepto (B0): 3
cat("Modelo estimado: Y =", round(B0, 2), "+", round(B1, 2), "* X\n")
## Modelo estimado: Y = 3 + 0 * X
c) Estimación para X = 22
cat("\n🔹 PUNTO 3.c) Estimación para X = 22 minutos\n")
##
## 🔹 PUNTO 3.c) Estimación para X = 22 minutos
X_est <- 22
Y_est <- B0 + B1 * X_est
cat("Calificación esperada:", round(Y_est, 4), "\n")
## Calificación esperada: 3
d) Intervalo de confianza del 95% para predicción
cat("\n🔹 PUNTO 3.d) Intervalo de confianza para la predicción (95%)\n")
##
## 🔹 PUNTO 3.d) Intervalo de confianza para la predicción (95%)
# Calcular errores
residuos <- Y - (B0 + B1 * c(NA, NA, NA, NA, NA)) # sin X reales no se puede hacer exactamente
# Como no se tienen los valores reales de X, estimamos el error cuadrático medio:
# Usamos fórmula directa: error estándar residual
SSE <- Syy - B1^2 * Sxx
MSE <- SSE / (n - 2)
s <- sqrt(MSE)
# Error estándar de la predicción
se_Yest <- s * sqrt(1/n + ((X_est - mean_X)^2 / Sxx))
# Intervalo de confianza
t_crit <- qt(0.975, df = n - 2)
margin_error <- t_crit * se_Yest
IC_inf <- Y_est - margin_error
IC_sup <- Y_est + margin_error
cat("Intervalo de confianza 95%: [", round(IC_inf, 4), ",", round(IC_sup, 4), "]\n")
## Intervalo de confianza 95%: [ 0.2996 , 5.7004 ]
e) ANOVA y prueba de significancia
cat("\n🔹 PUNTO 3.e) Tabla ANOVA y prueba de significancia\n")
##
## 🔹 PUNTO 3.e) Tabla ANOVA y prueba de significancia
# Suma de cuadrados
SSR <- B1^2 * Sxx # Regresión
SSE <- Syy - SSR # Error
SST <- Syy # Total
# Grados de libertad
gl_reg <- 1
gl_err <- n - 2
gl_total <- n - 1
# Cuadrados medios
MSR <- SSR / gl_reg
MSE <- SSE / gl_err
# Estadístico F
F_obs <- MSR / MSE
p_val <- pf(F_obs, gl_reg, gl_err, lower.tail = FALSE)
# Mostrar tabla ANOVA manual
anova_table <- data.frame(
Fuente = c("Regresión", "Error", "Total"),
SC = c(SSR, SSE, SST),
gl = c(gl_reg, gl_err, gl_total),
CM = c(MSR, MSE, NA)
)
print(anova_table)
## Fuente SC gl CM
## 1 Regresión 0 1 0.000000
## 2 Error 10 3 3.333333
## 3 Total 10 4 NA
cat("\nEstadístico F:", round(F_obs, 4), "\n")
##
## Estadístico F: 0
cat("Valor p:", round(p_val, 4), "\n")
## Valor p: 1
# Conclusión
if (p_val < 0.05) {
cat("→ El modelo de regresión es estadísticamente significativo al 5%.\n")
} else {
cat("→ No hay evidencia suficiente para afirmar que el modelo es significativo.\n")
}
## → No hay evidencia suficiente para afirmar que el modelo es significativo.
4 punto - Anova - ¿La satisfacción depende del tipo de paquete?
# Crear tabla de contingencia con los datos del punto 2
tabla <- matrix(c(25, 15, 10, # Pequeño
15, 25, 20, # Mediano
10, 20, 30), # Grande
nrow = 3, byrow = TRUE)
# Asignar nombres de filas y columnas
rownames(tabla) <- c("Pequeño", "Mediano", "Grande")
colnames(tabla) <- c("Aéreo", "Terrestre", "Marítimo")
# Convertir a tabla
tabla <- as.table(tabla)
# Ver la tabla
print(tabla)
## Aéreo Terrestre Marítimo
## Pequeño 25 15 10
## Mediano 15 25 20
## Grande 10 20 30
# Aplicar la prueba Chi-cuadrado
resultado <- chisq.test(tabla)
# Ver resultados
print(resultado)
##
## Pearson's Chi-squared test
##
## data: tabla
## X-squared = 19.125, df = 4, p-value = 0.0007427