Parcial 3

Punto 1

a. Prueba de hipótesis (t-test para medias independientes)

sucursal_A <- c(5, 6, 7, 8, 9)
sucursal_B <- c(5, 6, 7, 8, 9, 10)

cat("PUNTO 1 - a) Prueba t para diferencia de medias\n")
## PUNTO 1 - a) Prueba t para diferencia de medias
t_test <- t.test(sucursal_A, sucursal_B, var.equal = TRUE, conf.level = 0.99)
print(t_test)
## 
##  Two Sample t-test
## 
## data:  sucursal_A and sucursal_B
## t = -0.47238, df = 9, p-value = 0.6479
## alternative hypothesis: true difference in means is not equal to 0
## 99 percent confidence interval:
##  -3.939871  2.939871
## sample estimates:
## mean of x mean of y 
##       7.0       7.5
# 1. Hipótesis
cat("\nHipótesis:\n")
## 
## Hipótesis:
cat("H0: μ_A = μ_B (no hay diferencia en el tiempo promedio de entrega)\n")
## H0: μ_A = μ_B (no hay diferencia en el tiempo promedio de entrega)
cat("H1: μ_A ≠ μ_B (hay diferencia significativa en el tiempo promedio)\n")
## H1: μ_A ≠ μ_B (hay diferencia significativa en el tiempo promedio)

b) Intervalo de confianza del 99%

cat("\nPUNTO 1 - b) Intervalo de confianza (99%) para diferencia de medias\n")
## 
## PUNTO 1 - b) Intervalo de confianza (99%) para diferencia de medias
print(t_test$conf.int)
## [1] -3.939871  2.939871
## attr(,"conf.level")
## [1] 0.99
t_test <- t.test(sucursal_A, sucursal_B, var.equal = TRUE, conf.level = 0.99)

c) p-value

cat("\nPUNTO 1 - c) p-value:\n")
## 
## PUNTO 1 - c) p-value:
print(t_test$p.value)
## [1] 0.6479016
cat("\nEstadístico t:", t_test$statistic, "\n")
## 
## Estadístico t: -0.4723775
cat("Grados de libertad:", t_test$parameter, "\n")
## Grados de libertad: 9
cat("Valor p:", t_test$p.value, "\n")
## Valor p: 0.6479016

d Distribución normal- Decisión con α = 0.01

alpha <- 0.01
cat("\nNivel de significancia: α =", alpha, "\n")
## 
## Nivel de significancia: α = 0.01
if (t_test$p.value < alpha) {
  cat("→ Se rechaza H0\n")
} else {
  cat("→ No se rechaza H0\n")
}
## → No se rechaza H0

5. Conclusión en contexto

cat("\nConclusión:\n")
## 
## Conclusión:
if (t_test$p.value < alpha) {
  cat("Hay evidencia significativa al 1% de que los tiempos promedio de entrega entre sucursales son diferentes.\n")
} else {
  cat("No hay evidencia suficiente para afirmar que los tiempos promedio de entrega entre sucursales son diferentes.\n")
}
## No hay evidencia suficiente para afirmar que los tiempos promedio de entrega entre sucursales son diferentes.

2 punto - Relación de significancia

tabla <- matrix(c(
  25, 15, 10,   # Pequeño: Aéreo, Terrestre, Marítimo
  15, 25, 20,   # Mediano
  10, 20, 30    # Grande
), 
nrow = 3, byrow = TRUE)

rownames(tabla) <- c("Pequeño", "Mediano", "Grande")
colnames(tabla) <- c("Aéreo", "Terrestre", "Marítimo")

cat("🔹 Tabla de contingencia:\n")
## 🔹 Tabla de contingencia:
print(tabla)
##         Aéreo Terrestre Marítimo
## Pequeño    25        15       10
## Mediano    15        25       20
## Grande     10        20       30
# Prueba de independencia (Chi-cuadrado)

cat("\n🔹 PUNTO 2: Prueba Chi-cuadrado de independencia\n")
## 
## 🔹 PUNTO 2: Prueba Chi-cuadrado de independencia
# 1. Formular las hipótesis
cat("\nHipótesis:\n")
## 
## Hipótesis:
cat("H0: El tipo de paquete es independiente del método de entrega\n")
## H0: El tipo de paquete es independiente del método de entrega
cat("H1: Existe una relación significativa entre el tipo de paquete y el método de entrega\n")
## H1: Existe una relación significativa entre el tipo de paquete y el método de entrega
# 2. Realizar la prueba
chi_test <- chisq.test(tabla)

# 3. Resultados
cat("\nEstadístico Chi-cuadrado:", chi_test$statistic, "\n")
## 
## Estadístico Chi-cuadrado: 19.125
cat("Grados de libertad:", chi_test$parameter, "\n")
## Grados de libertad: 4
cat("Valor p:", chi_test$p.value, "\n")
## Valor p: 0.0007427211
# 4. Nivel de significancia
alpha <- 0.05
cat("\nNivel de significancia: α =", alpha, "\n")
## 
## Nivel de significancia: α = 0.05
# 5. Decisión
if (chi_test$p.value < alpha) {
  cat("→ Se rechaza H0\n")
} else {
  cat("→ No se rechaza H0\n")
}
## → Se rechaza H0
# 6. Conclusión en contexto
cat("\nConclusión:\n")
## 
## Conclusión:
if (chi_test$p.value < alpha) {
  cat("Existe evidencia significativa de que el tipo de paquete está relacionado con el método de entrega.\n")
} else {
  cat("No hay evidencia suficiente para afirmar que el tipo de paquete influya en el método de entrega.\n")
}
## Existe evidencia significativa de que el tipo de paquete está relacionado con el método de entrega.

3 punto - Correlación

# Datos conocidos
Y <- c(4, 3, 2, 1, 5)         # Satisfacción
n <- length(Y)
sum_Y <- sum(Y)              # ∑Y
sum_Y2 <- sum(Y^2)           # ∑Y^2
sum_X <- 100                 # ∑X
sum_X2 <- 2250               # ∑X^2
sum_XY <- 300                # ∑XY

# Derivados
mean_X <- sum_X / n
mean_Y <- sum_Y / n

# Calcular Sxx, Syy, Sxy
Sxx <- sum_X2 - (sum_X^2 / n)
Syy <- sum_Y2 - (sum_Y^2 / n)
Sxy <- sum_XY - (sum_X * sum_Y / n)

a) Correlación R y R^2

cat("🔹 PUNTO 3.a) Coeficientes de correlación\n")
## 🔹 PUNTO 3.a) Coeficientes de correlación
R <- Sxy / sqrt(Sxx * Syy)
R2 <- R^2

cat("Coeficiente de correlación (R):", round(R, 4), "\n")
## Coeficiente de correlación (R): 0
cat("Coeficiente de determinación (R^2):", round(R2, 4), "\n")
## Coeficiente de determinación (R^2): 0
if (abs(R) > 0.7) {
  cat("→ Existe una correlación significativa y fuerte entre las variables.\n")
} else {
  cat("→ La correlación no es fuerte o significativa.\n")
}
## → La correlación no es fuerte o significativa.

b) Modelo de regresión lineal

cat("\n🔹 PUNTO 3.b) Modelo de regresión lineal Y = B0 + B1*X\n")
## 
## 🔹 PUNTO 3.b) Modelo de regresión lineal Y = B0 + B1*X
B1 <- Sxy / Sxx
B0 <- mean_Y - B1 * mean_X

cat("Pendiente (B1):", round(B1, 4), "\n")
## Pendiente (B1): 0
cat("Intercepto (B0):", round(B0, 4), "\n")
## Intercepto (B0): 3
cat("Modelo estimado: Y =", round(B0, 2), "+", round(B1, 2), "* X\n")
## Modelo estimado: Y = 3 + 0 * X

c) Estimación para X = 22

cat("\n🔹 PUNTO 3.c) Estimación para X = 22 minutos\n")
## 
## 🔹 PUNTO 3.c) Estimación para X = 22 minutos
X_est <- 22
Y_est <- B0 + B1 * X_est
cat("Calificación esperada:", round(Y_est, 4), "\n")
## Calificación esperada: 3

d) Intervalo de confianza del 95% para predicción

cat("\n🔹 PUNTO 3.d) Intervalo de confianza para la predicción (95%)\n")
## 
## 🔹 PUNTO 3.d) Intervalo de confianza para la predicción (95%)
# Calcular errores
residuos <- Y - (B0 + B1 * c(NA, NA, NA, NA, NA))  # sin X reales no se puede hacer exactamente
# Como no se tienen los valores reales de X, estimamos el error cuadrático medio:
# Usamos fórmula directa: error estándar residual
SSE <- Syy - B1^2 * Sxx
MSE <- SSE / (n - 2)
s <- sqrt(MSE)

# Error estándar de la predicción
se_Yest <- s * sqrt(1/n + ((X_est - mean_X)^2 / Sxx))

# Intervalo de confianza
t_crit <- qt(0.975, df = n - 2)
margin_error <- t_crit * se_Yest

IC_inf <- Y_est - margin_error
IC_sup <- Y_est + margin_error

cat("Intervalo de confianza 95%: [", round(IC_inf, 4), ",", round(IC_sup, 4), "]\n")
## Intervalo de confianza 95%: [ 0.2996 , 5.7004 ]

e) ANOVA y prueba de significancia

cat("\n🔹 PUNTO 3.e) Tabla ANOVA y prueba de significancia\n")
## 
## 🔹 PUNTO 3.e) Tabla ANOVA y prueba de significancia
# Suma de cuadrados
SSR <- B1^2 * Sxx        # Regresión
SSE <- Syy - SSR         # Error
SST <- Syy               # Total

# Grados de libertad
gl_reg <- 1
gl_err <- n - 2
gl_total <- n - 1

# Cuadrados medios
MSR <- SSR / gl_reg
MSE <- SSE / gl_err

# Estadístico F
F_obs <- MSR / MSE
p_val <- pf(F_obs, gl_reg, gl_err, lower.tail = FALSE)

# Mostrar tabla ANOVA manual
anova_table <- data.frame(
  Fuente = c("Regresión", "Error", "Total"),
  SC = c(SSR, SSE, SST),
  gl = c(gl_reg, gl_err, gl_total),
  CM = c(MSR, MSE, NA)
)
print(anova_table)
##      Fuente SC gl       CM
## 1 Regresión  0  1 0.000000
## 2     Error 10  3 3.333333
## 3     Total 10  4       NA
cat("\nEstadístico F:", round(F_obs, 4), "\n")
## 
## Estadístico F: 0
cat("Valor p:", round(p_val, 4), "\n")
## Valor p: 1
# Conclusión
if (p_val < 0.05) {
  cat("→ El modelo de regresión es estadísticamente significativo al 5%.\n")
} else {
  cat("→ No hay evidencia suficiente para afirmar que el modelo es significativo.\n")
}
## → No hay evidencia suficiente para afirmar que el modelo es significativo.

4 punto - Anova - ¿La satisfacción depende del tipo de paquete?

# Crear tabla de contingencia con los datos del punto 2
tabla <- matrix(c(25, 15, 10,   # Pequeño
                  15, 25, 20,   # Mediano
                  10, 20, 30),  # Grande
                nrow = 3, byrow = TRUE)

# Asignar nombres de filas y columnas
rownames(tabla) <- c("Pequeño", "Mediano", "Grande")
colnames(tabla) <- c("Aéreo", "Terrestre", "Marítimo")

# Convertir a tabla
tabla <- as.table(tabla)

# Ver la tabla
print(tabla)
##         Aéreo Terrestre Marítimo
## Pequeño    25        15       10
## Mediano    15        25       20
## Grande     10        20       30
# Aplicar la prueba Chi-cuadrado
resultado <- chisq.test(tabla)

# Ver resultados
print(resultado)
## 
##  Pearson's Chi-squared test
## 
## data:  tabla
## X-squared = 19.125, df = 4, p-value = 0.0007427