library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
datos <- read.csv("datos_negocios_extra_5_logistica.csv")
head(datos)
## Ruta KM_Recorridos Tiempo_Entrega_Horas Costos_Operativos
## 1 Ruta Sur 1796 17.2 17458.55
## 2 Ruta Norte 4856 29.8 9828.49
## 3 Ruta Sur 2909 13.3 11964.23
## 4 Ruta Oeste 3643 12.7 18625.55
## 5 Ruta Este 4753 23.1 12811.67
## 6 Ruta Oeste 4354 1.1 19844.28
summary(datos)
## Ruta KM_Recorridos Tiempo_Entrega_Horas Costos_Operativos
## Length:100 Min. : 166 Min. : 1.10 Min. : 1009
## Class :character 1st Qu.:1471 1st Qu.:13.07 1st Qu.: 5189
## Mode :character Median :2729 Median :25.90 Median :10408
## Mean :2576 Mean :25.54 Mean :11049
## 3rd Qu.:3551 3rd Qu.:39.67 3rd Qu.:16304
## Max. :4948 Max. :47.60 Max. :19844
library(ggplot2)
ggplot(datos, aes(x = Ruta, y = Costos_Operativos, fill = Ruta)) +
geom_boxplot() +
labs(title = "Distribución de costos operativos por ruta",
x = "Ruta",
y = "Costos operativos") +
theme_minimal()
resumen_ruta <- datos %>%
group_by(Ruta) %>%
summarise(
Promedio_KM = mean(KM_Recorridos),
Promedio_Tiempo = mean(Tiempo_Entrega_Horas),
Promedio_Costos = mean(Costos_Operativos)
)
print(resumen_ruta)
## # A tibble: 4 × 4
## Ruta Promedio_KM Promedio_Tiempo Promedio_Costos
## <chr> <dbl> <dbl> <dbl>
## 1 Ruta Este 3016. 26.9 11907.
## 2 Ruta Norte 2594. 25.2 11616.
## 3 Ruta Oeste 2094. 23.1 9899.
## 4 Ruta Sur 2757. 27.3 11235.
ggplot(datos, aes(x = Costos_Operativos)) +
geom_histogram(binwidth = 500, fill = "skyblue", color = "black", alpha = 0.7) +
geom_density(aes(y = ..density.. * 500), color = "blue", size = 1) +
labs(title = "Distribución de los Costos Operativos",
x = "Costos Operativos",
y = "Frecuencia") +
theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once per session.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once per session.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
datos_Este <- filter(datos, Ruta == "Ruta Este")
datos_Este
## Ruta KM_Recorridos Tiempo_Entrega_Horas Costos_Operativos
## 1 Ruta Este 4753 23.1 12811.67
## 2 Ruta Este 1990 32.7 19360.42
## 3 Ruta Este 1350 2.4 8201.24
## 4 Ruta Este 4437 2.1 2325.08
## 5 Ruta Este 3520 28.4 4201.60
## 6 Ruta Este 1209 45.3 4037.08
## 7 Ruta Este 385 34.6 14949.37
## 8 Ruta Este 4217 37.9 19382.89
## 9 Ruta Este 2340 41.1 9949.11
## 10 Ruta Este 3866 33.6 18684.39
## 11 Ruta Este 2890 18.2 19677.58
## 12 Ruta Este 3324 46.9 19546.14
## 13 Ruta Este 4892 27.7 4820.84
## 14 Ruta Este 2955 46.7 3485.44
## 15 Ruta Este 2641 21.5 17623.80
## 16 Ruta Este 4948 32.1 9434.97
## 17 Ruta Este 554 1.3 3520.50
## 18 Ruta Este 3518 13.4 15258.10
## 19 Ruta Este 4899 21.6 17363.53
## 20 Ruta Este 1638 27.5 13503.59
media_costos_Este <- mean(datos_Este$Costos_Operativos)
sd_costos_Este <- sd(datos_Este$Costos_Operativos)
n_Este <- nrow(datos_Este)
error_media_Este <- qt(0.975, df = n_Este - 1) * sd_costos_Este / sqrt(n_Este)
IC_media_Este <- c(media_costos_Este - error_media_Este,
media_costos_Este + error_media_Este)
cat("Media de costos operativos:", media_costos_Este, "\n")
## Media de costos operativos: 11906.87
cat("Intervalo de confianza para la media poblacional de los costos operativos en la Ruta Este: (",
IC_media_Este[1], ", ", IC_media_Este[2], ")\n", sep = "")
## Intervalo de confianza para la media poblacional de los costos operativos en la Ruta Este: (8887.708, 14926.03)
n = 20
x̄ = 11906.87
s = 6451.07
# Hipótesis
H0 <- "μ <= 11000"
H1 <- "μ > 11000"
# Cálculos
media_costos_Este <- mean(datos_Este$Costos_Operativos)
sd_costos_Este <- sd(datos_Este$Costos_Operativos)
n_Este <- nrow(datos_Este)
mu_0 <- 11000
alpha <- 0.05
# Estadístico de prueba
t_calculado <- (media_costos_Este - mu_0) /
(sd_costos_Este / sqrt(n_Este))
# Grados de libertad
gl <- n_Este - 1
# Valor crítico
t_critico <- qt(1 - alpha, df = gl)
# Resultados
cat("Hipótesis nula:", H0, "\n")
## Hipótesis nula: μ <= 11000
cat("Hipótesis alternativa:", H1, "\n\n")
## Hipótesis alternativa: μ > 11000
cat("Media muestral:", media_costos_Este, "\n")
## Media muestral: 11906.87
cat("Desviación estándar muestral:", sd_costos_Este, "\n")
## Desviación estándar muestral: 6450.995
cat("Tamaño de muestra:", n_Este, "\n\n")
## Tamaño de muestra: 20
cat("t calculado:", t_calculado, "\n")
## t calculado: 0.6286833
cat("t crítico:", t_critico, "\n\n")
## t crítico: 1.729133
# Decisión
if (t_calculado > t_critico) {
cat("Decisión: Se rechaza H0\n")
cat("Conclusión: Existe evidencia estadística suficiente para afirmar que el costo promedio operativo en la Ruta Este es mayor que 11000.\n")
} else {
cat("Decisión: No se rechaza H0\n")
cat("Conclusión: No existe evidencia estadística suficiente para afirmar que el costo promedio operativo en la Ruta Este es mayor que 11000.\n")
}
## Decisión: No se rechaza H0
## Conclusión: No existe evidencia estadística suficiente para afirmar que el costo promedio operativo en la Ruta Este es mayor que 11000.