Parcial 3

Punto 1

a. Prueba de hipótesis (t-test para medias independientes)

sucursal_A <- c(5, 6, 7, 8, 9)
sucursal_B <- c(5, 6, 7, 8, 9, 10)

cat("PUNTO 1 - a) Prueba t para diferencia de medias\n")

## PUNTO 1 - a) Prueba t para diferencia de medias

t_test <- t.test(sucursal_A, sucursal_B, var.equal = TRUE, conf.level = 0.99)
print(t_test)

## 
##  Two Sample t-test
## 
## data:  sucursal_A and sucursal_B
## t = -0.47238, df = 9, p-value = 0.6479
## alternative hypothesis: true difference in means is not equal to 0
## 99 percent confidence interval:
##  -3.939871  2.939871
## sample estimates:
## mean of x mean of y 
##       7.0       7.5

# 1. Hipótesis
cat("\nHipótesis:\n")

## 
## Hipótesis:

cat("H0: μ_A = μ_B (no hay diferencia en el tiempo promedio de entrega)\n")

## H0: μ_A = μ_B (no hay diferencia en el tiempo promedio de entrega)

cat("H1: μ_A ≠ μ_B (hay diferencia significativa en el tiempo promedio)\n")

## H1: μ_A ≠ μ_B (hay diferencia significativa en el tiempo promedio)

b) Intervalo de confianza del 99%

cat("\nPUNTO 1 - b) Intervalo de confianza (99%) para diferencia de medias\n")

## 
## PUNTO 1 - b) Intervalo de confianza (99%) para diferencia de medias

print(t_test$conf.int)

## [1] -3.939871  2.939871
## attr(,"conf.level")
## [1] 0.99

t_test <- t.test(sucursal_A, sucursal_B, var.equal = TRUE, conf.level = 0.99)

c) p-value

cat("\nPUNTO 1 - c) p-value:\n")

## 
## PUNTO 1 - c) p-value:

print(t_test$p.value)

## [1] 0.6479016

cat("\nEstadístico t:", t_test$statistic, "\n")

## 
## Estadístico t: -0.4723775

cat("Grados de libertad:", t_test$parameter, "\n")

## Grados de libertad: 9

cat("Valor p:", t_test$p.value, "\n")

## Valor p: 0.6479016

d Distribución normal- Decisión con α = 0.01

alpha <- 0.01
cat("\nNivel de significancia: α =", alpha, "\n")

## 
## Nivel de significancia: α = 0.01

if (t_test$p.value < alpha) {
  cat("→ Se rechaza H0\n")
} else {
  cat("→ No se rechaza H0\n")
}

## → No se rechaza H0

5. Conclusión en contexto

cat("\nConclusión:\n")

## 
## Conclusión:

if (t_test$p.value < alpha) {
  cat("Hay evidencia significativa al 1% de que los tiempos promedio de entrega entre sucursales son diferentes.\n")
} else {
  cat("No hay evidencia suficiente para afirmar que los tiempos promedio de entrega entre sucursales son diferentes.\n")
}

## No hay evidencia suficiente para afirmar que los tiempos promedio de entrega entre sucursales son diferentes.

2 punto - Relación de significancia

tabla <- matrix(c(
  25, 15, 10,   # Pequeño: Aéreo, Terrestre, Marítimo
  15, 25, 20,   # Mediano
  10, 20, 30    # Grande
), 
nrow = 3, byrow = TRUE)

rownames(tabla) <- c("Pequeño", "Mediano", "Grande")
colnames(tabla) <- c("Aéreo", "Terrestre", "Marítimo")

cat("🔹 Tabla de contingencia:\n")

## 🔹 Tabla de contingencia:

print(tabla)

##         Aéreo Terrestre Marítimo
## Pequeño    25        15       10
## Mediano    15        25       20
## Grande     10        20       30

# Prueba de independencia (Chi-cuadrado)

cat("\n🔹 PUNTO 2: Prueba Chi-cuadrado de independencia\n")

## 
## 🔹 PUNTO 2: Prueba Chi-cuadrado de independencia

# 1. Formular las hipótesis
cat("\nHipótesis:\n")

## 
## Hipótesis:

cat("H0: El tipo de paquete es independiente del método de entrega\n")

## H0: El tipo de paquete es independiente del método de entrega

cat("H1: Existe una relación significativa entre el tipo de paquete y el método de entrega\n")

## H1: Existe una relación significativa entre el tipo de paquete y el método de entrega

# 2. Realizar la prueba
chi_test <- chisq.test(tabla)

# 3. Resultados
cat("\nEstadístico Chi-cuadrado:", chi_test$statistic, "\n")

## 
## Estadístico Chi-cuadrado: 19.125

cat("Grados de libertad:", chi_test$parameter, "\n")

## Grados de libertad: 4

cat("Valor p:", chi_test$p.value, "\n")

## Valor p: 0.0007427211

# 4. Nivel de significancia
alpha <- 0.05
cat("\nNivel de significancia: α =", alpha, "\n")

## 
## Nivel de significancia: α = 0.05

# 5. Decisión
if (chi_test$p.value < alpha) {
  cat("→ Se rechaza H0\n")
} else {
  cat("→ No se rechaza H0\n")
}

## → Se rechaza H0

# 6. Conclusión en contexto
cat("\nConclusión:\n")

## 
## Conclusión:

if (chi_test$p.value < alpha) {
  cat("Existe evidencia significativa de que el tipo de paquete está relacionado con el método de entrega.\n")
} else {
  cat("No hay evidencia suficiente para afirmar que el tipo de paquete influya en el método de entrega.\n")
}

## Existe evidencia significativa de que el tipo de paquete está relacionado con el método de entrega.

3 punto - Correlación

# Datos conocidos
Y <- c(4, 3, 2, 1, 5)         # Satisfacción
n <- length(Y)
sum_Y <- sum(Y)              # ∑Y
sum_Y2 <- sum(Y^2)           # ∑Y^2
sum_X <- 100                 # ∑X
sum_X2 <- 2250               # ∑X^2
sum_XY <- 300                # ∑XY

# Derivados
mean_X <- sum_X / n
mean_Y <- sum_Y / n

# Calcular Sxx, Syy, Sxy
Sxx <- sum_X2 - (sum_X^2 / n)
Syy <- sum_Y2 - (sum_Y^2 / n)
Sxy <- sum_XY - (sum_X * sum_Y / n)

a) Correlación R y R^2

cat("🔹 PUNTO 3.a) Coeficientes de correlación\n")

## 🔹 PUNTO 3.a) Coeficientes de correlación

R <- Sxy / sqrt(Sxx * Syy)
R2 <- R^2

cat("Coeficiente de correlación (R):", round(R, 4), "\n")

## Coeficiente de correlación (R): 0

cat("Coeficiente de determinación (R^2):", round(R2, 4), "\n")

## Coeficiente de determinación (R^2): 0

if (abs(R) > 0.7) {
  cat("→ Existe una correlación significativa y fuerte entre las variables.\n")
} else {
  cat("→ La correlación no es fuerte o significativa.\n")
}

## → La correlación no es fuerte o significativa.

b) Modelo de regresión lineal

cat("\n🔹 PUNTO 3.b) Modelo de regresión lineal Y = B0 + B1*X\n")

## 
## 🔹 PUNTO 3.b) Modelo de regresión lineal Y = B0 + B1*X

B1 <- Sxy / Sxx
B0 <- mean_Y - B1 * mean_X

cat("Pendiente (B1):", round(B1, 4), "\n")

## Pendiente (B1): 0

cat("Intercepto (B0):", round(B0, 4), "\n")

## Intercepto (B0): 3

cat("Modelo estimado: Y =", round(B0, 2), "+", round(B1, 2), "* X\n")

## Modelo estimado: Y = 3 + 0 * X

c) Estimación para X = 22

cat("\n🔹 PUNTO 3.c) Estimación para X = 22 minutos\n")

## 
## 🔹 PUNTO 3.c) Estimación para X = 22 minutos

X_est <- 22
Y_est <- B0 + B1 * X_est
cat("Calificación esperada:", round(Y_est, 4), "\n")

## Calificación esperada: 3

d) Intervalo de confianza del 95% para predicción

cat("\n🔹 PUNTO 3.d) Intervalo de confianza para la predicción (95%)\n")

## 
## 🔹 PUNTO 3.d) Intervalo de confianza para la predicción (95%)

# Calcular errores
residuos <- Y - (B0 + B1 * c(NA, NA, NA, NA, NA))  # sin X reales no se puede hacer exactamente
# Como no se tienen los valores reales de X, estimamos el error cuadrático medio:
# Usamos fórmula directa: error estándar residual
SSE <- Syy - B1^2 * Sxx
MSE <- SSE / (n - 2)
s <- sqrt(MSE)

# Error estándar de la predicción
se_Yest <- s * sqrt(1/n + ((X_est - mean_X)^2 / Sxx))

# Intervalo de confianza
t_crit <- qt(0.975, df = n - 2)
margin_error <- t_crit * se_Yest

IC_inf <- Y_est - margin_error
IC_sup <- Y_est + margin_error

cat("Intervalo de confianza 95%: [", round(IC_inf, 4), ",", round(IC_sup, 4), "]\n")

## Intervalo de confianza 95%: [ 0.2996 , 5.7004 ]

e) ANOVA y prueba de significancia

cat("\n🔹 PUNTO 3.e) Tabla ANOVA y prueba de significancia\n")

## 
## 🔹 PUNTO 3.e) Tabla ANOVA y prueba de significancia

# Suma de cuadrados
SSR <- B1^2 * Sxx        # Regresión
SSE <- Syy - SSR         # Error
SST <- Syy               # Total

# Grados de libertad
gl_reg <- 1
gl_err <- n - 2
gl_total <- n - 1

# Cuadrados medios
MSR <- SSR / gl_reg
MSE <- SSE / gl_err

# Estadístico F
F_obs <- MSR / MSE
p_val <- pf(F_obs, gl_reg, gl_err, lower.tail = FALSE)

# Mostrar tabla ANOVA manual
anova_table <- data.frame(
  Fuente = c("Regresión", "Error", "Total"),
  SC = c(SSR, SSE, SST),
  gl = c(gl_reg, gl_err, gl_total),
  CM = c(MSR, MSE, NA)
)
print(anova_table)

##      Fuente SC gl       CM
## 1 Regresión  0  1 0.000000
## 2     Error 10  3 3.333333
## 3     Total 10  4       NA

cat("\nEstadístico F:", round(F_obs, 4), "\n")

## 
## Estadístico F: 0

cat("Valor p:", round(p_val, 4), "\n")

## Valor p: 1

# Conclusión
if (p_val < 0.05) {
  cat("→ El modelo de regresión es estadísticamente significativo al 5%.\n")
} else {
  cat("→ No hay evidencia suficiente para afirmar que el modelo es significativo.\n")
}

## → No hay evidencia suficiente para afirmar que el modelo es significativo.

4 punto - Anova - ¿La satisfacción depende del tipo de paquete?

# Crear tabla de contingencia con los datos del punto 2
tabla <- matrix(c(25, 15, 10,   # Pequeño
                  15, 25, 20,   # Mediano
                  10, 20, 30),  # Grande
                nrow = 3, byrow = TRUE)

# Asignar nombres de filas y columnas
rownames(tabla) <- c("Pequeño", "Mediano", "Grande")
colnames(tabla) <- c("Aéreo", "Terrestre", "Marítimo")

# Convertir a tabla
tabla <- as.table(tabla)

# Ver la tabla
print(tabla)

##         Aéreo Terrestre Marítimo
## Pequeño    25        15       10
## Mediano    15        25       20
## Grande     10        20       30

# Aplicar la prueba Chi-cuadrado
resultado <- chisq.test(tabla)

# Ver resultados
print(resultado)

## 
##  Pearson's Chi-squared test
## 
## data:  tabla
## X-squared = 19.125, df = 4, p-value = 0.0007427

Código - parcial 3

Juliana Cabiativa

2025-05-26

Parcial 3

Punto 1

a. Prueba de hipótesis (t-test para medias independientes)

b) Intervalo de confianza del 99%

c) p-value

d Distribución normal- Decisión con α = 0.01

5. Conclusión en contexto

2 punto - Relación de significancia

3 punto - Correlación

a) Correlación R y R^2

b) Modelo de regresión lineal

c) Estimación para X = 22

d) Intervalo de confianza del 95% para predicción

e) ANOVA y prueba de significancia

4 punto - Anova - ¿La satisfacción depende del tipo de paquete?