Descripción y estimación estadística en logística empresarial


Este análisis consta de 100 observaciones de datos logísticos, en donde se muestran variables como costos, tiempos y desempeño operativo.
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
datos <- read.csv("datos_negocios_extra_5_logistica.csv")
head(datos)
##         Ruta KM_Recorridos Tiempo_Entrega_Horas Costos_Operativos
## 1   Ruta Sur          1796                 17.2          17458.55
## 2 Ruta Norte          4856                 29.8           9828.49
## 3   Ruta Sur          2909                 13.3          11964.23
## 4 Ruta Oeste          3643                 12.7          18625.55
## 5  Ruta Este          4753                 23.1          12811.67
## 6 Ruta Oeste          4354                  1.1          19844.28



Resumen estadístico de las variables numéricas

summary(datos)
##      Ruta           KM_Recorridos  Tiempo_Entrega_Horas Costos_Operativos
##  Length:100         Min.   : 166   Min.   : 1.10        Min.   : 1009    
##  Class :character   1st Qu.:1471   1st Qu.:13.07        1st Qu.: 5189    
##  Mode  :character   Median :2729   Median :25.90        Median :10408    
##                     Mean   :2576   Mean   :25.54        Mean   :11049    
##                     3rd Qu.:3551   3rd Qu.:39.67        3rd Qu.:16304    
##                     Max.   :4948   Max.   :47.60        Max.   :19844
El resumen estadístico muestra que el promedio de kilómetros recorridos es de 2576, el tiempo promedio de entrega es de 25.54 horas y el promedio de los costos operativos es de 11049.


library(ggplot2)
ggplot(datos, aes(x = Ruta, y = Costos_Operativos, fill = Ruta)) +
  geom_boxplot() +
  labs(title = "Distribución de costos operativos por ruta",
       x = "Ruta",
       y = "Costos operativos") +
  theme_minimal()

Este gráfico muestra la variabilidad de los kilómetros recorridos en cada ruta. Se pueden observar diferencias en la mediana y en la dispersión de los datos entre las distintas rutas.



resumen_ruta <- datos %>%
  group_by(Ruta) %>%
  summarise(
    Promedio_KM = mean(KM_Recorridos),
    Promedio_Tiempo = mean(Tiempo_Entrega_Horas),
    Promedio_Costos = mean(Costos_Operativos)
    )

print(resumen_ruta)
## # A tibble: 4 × 4
##   Ruta       Promedio_KM Promedio_Tiempo Promedio_Costos
##   <chr>            <dbl>           <dbl>           <dbl>
## 1 Ruta Este        3016.            26.9          11907.
## 2 Ruta Norte       2594.            25.2          11616.
## 3 Ruta Oeste       2094.            23.1           9899.
## 4 Ruta Sur         2757.            27.3          11235.
En la Ruta Este, el promedio de kilómetros recorridos es de 3016, con un tiempo promedio de 26.9 horas y costos operativos de 11907.
En la Ruta Norte, el promedio de kilómetros recorridos es de 2594, con un tiempo promedio de 25.2 horas y costos operativos de 11616.
En la Ruta Oeste, el promedio de kilómetros recorridos es de 2094, con un tiempo promedio de 23.1 horas y costos operativos de 9899.
En la Ruta Sur, el promedio de kilómetros recorridos es de 2757, con un tiempo promedio de 27.3 horas y costos operativos de 11235.
Conclusión: La Ruta Este presenta los valores más altos en kilómetros y costos operativos, mientras que la Ruta Oeste muestra los niveles más bajos. La Ruta Sur destaca por tener el mayor tiempo de entrega promedio, lo que sugiere diferencias en eficiencia entre las rutas.



ggplot(datos, aes(x = Costos_Operativos)) +
  geom_histogram(binwidth = 500, fill = "skyblue", color = "black", alpha = 0.7) +
  geom_density(aes(y = ..density.. * 500), color = "blue", size = 1) +
  labs(title = "Distribución de los Costos Operativos",
       x = "Costos Operativos",
       y = "Frecuencia") +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once per session.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once per session.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

El histograma muestra la distribución de los costos operativos, donde se observa una alta dispersión de los valores a lo largo de un rango amplio. No existe una concentración clara en un solo intervalo, lo que indica variabilidad significativa en los costos. Además, se aprecian múltiples picos, lo que sugiere posibles diferencias en los niveles operativos dentro de los datos.



Estimación - Intervalo de confianza para la media

1. Calcular un intervalo de confianza al 95% para la media poblacional de los costos operativos en la Ruta Este. Interpretar el intervalo obtenido y evaluar si es posible hacer inferencias sobre el comportamiento de los costos en esta ruta.


Datos
Muestra: n = 20 rutas
Media muestral (x̄): calculada a partir de los costos operativos de la Ruta Este (muestra)
Desviación estándar muestral (s): calculada a partir de los costos operativos de la Ruta Este (muestra)
Nivel de confianza: 95%
datos_Este <- filter(datos, Ruta == "Ruta Este")
datos_Este
##         Ruta KM_Recorridos Tiempo_Entrega_Horas Costos_Operativos
## 1  Ruta Este          4753                 23.1          12811.67
## 2  Ruta Este          1990                 32.7          19360.42
## 3  Ruta Este          1350                  2.4           8201.24
## 4  Ruta Este          4437                  2.1           2325.08
## 5  Ruta Este          3520                 28.4           4201.60
## 6  Ruta Este          1209                 45.3           4037.08
## 7  Ruta Este           385                 34.6          14949.37
## 8  Ruta Este          4217                 37.9          19382.89
## 9  Ruta Este          2340                 41.1           9949.11
## 10 Ruta Este          3866                 33.6          18684.39
## 11 Ruta Este          2890                 18.2          19677.58
## 12 Ruta Este          3324                 46.9          19546.14
## 13 Ruta Este          4892                 27.7           4820.84
## 14 Ruta Este          2955                 46.7           3485.44
## 15 Ruta Este          2641                 21.5          17623.80
## 16 Ruta Este          4948                 32.1           9434.97
## 17 Ruta Este           554                  1.3           3520.50
## 18 Ruta Este          3518                 13.4          15258.10
## 19 Ruta Este          4899                 21.6          17363.53
## 20 Ruta Este          1638                 27.5          13503.59
media_costos_Este <- mean(datos_Este$Costos_Operativos)
sd_costos_Este <- sd(datos_Este$Costos_Operativos)
n_Este <- nrow(datos_Este)

error_media_Este <- qt(0.975, df = n_Este - 1) * sd_costos_Este / sqrt(n_Este)

IC_media_Este <- c(media_costos_Este - error_media_Este,
                   media_costos_Este + error_media_Este)

cat("Media de costos operativos:", media_costos_Este, "\n")
## Media de costos operativos: 11906.87
cat("Intervalo de confianza para la media poblacional de los costos operativos en la Ruta Este: (",
    IC_media_Este[1], ", ", IC_media_Este[2], ")\n", sep = "")
## Intervalo de confianza para la media poblacional de los costos operativos en la Ruta Este: (8887.708, 14926.03)
Interpretación: El intervalo de confianza al 95% indica que la media poblacional de los costos operativos en la Ruta Este se encuentra entre 8887.708 y 14926.03. Esto significa que, con un 95% de confianza, el verdadero costo promedio de operación en esta ruta se ubica dentro de este rango.



Prueba de Hipótesis para la Media de los Costos Operativos en la Ruta Este

La empresa desea verificar si el costo promedio operativo de la Ruta Este es mayor que 11000 unidades monetarias. Para ello, se toma la variable Costos Operativos correspondiente a dicha ruta.
Suponga que se obtuvo:

n = 20
x̄ = 11906.87
s = 6451.07

Se desea realizar una prueba de hipótesis con un nivel de significancia del 5%.
# Hipótesis
H0 <- "μ <= 11000"
H1 <- "μ > 11000"

# Cálculos
media_costos_Este <- mean(datos_Este$Costos_Operativos)
sd_costos_Este <- sd(datos_Este$Costos_Operativos)
n_Este <- nrow(datos_Este)

mu_0 <- 11000
alpha <- 0.05

# Estadístico de prueba
t_calculado <- (media_costos_Este - mu_0) / 
  (sd_costos_Este / sqrt(n_Este))

# Grados de libertad
gl <- n_Este - 1

# Valor crítico
t_critico <- qt(1 - alpha, df = gl)

# Resultados
cat("Hipótesis nula:", H0, "\n")
## Hipótesis nula: μ <= 11000
cat("Hipótesis alternativa:", H1, "\n\n")
## Hipótesis alternativa: μ > 11000
cat("Media muestral:", media_costos_Este, "\n")
## Media muestral: 11906.87
cat("Desviación estándar muestral:", sd_costos_Este, "\n")
## Desviación estándar muestral: 6450.995
cat("Tamaño de muestra:", n_Este, "\n\n")
## Tamaño de muestra: 20
cat("t calculado:", t_calculado, "\n")
## t calculado: 0.6286833
cat("t crítico:", t_critico, "\n\n")
## t crítico: 1.729133
# Decisión
if (t_calculado > t_critico) {
  
  cat("Decisión: Se rechaza H0\n")
  
  cat("Conclusión: Existe evidencia estadística suficiente para afirmar que el costo promedio operativo en la Ruta Este es mayor que 11000.\n")
  
} else {
  
  cat("Decisión: No se rechaza H0\n")
  
  cat("Conclusión: No existe evidencia estadística suficiente para afirmar que el costo promedio operativo en la Ruta Este es mayor que 11000.\n")
}
## Decisión: No se rechaza H0
## Conclusión: No existe evidencia estadística suficiente para afirmar que el costo promedio operativo en la Ruta Este es mayor que 11000.