Análisis Descriptivo

Tablas Descriptivas

library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

datos<-read.csv("datos_negocios_extra_1_proveedores.csv",
 sep=",",header=TRUE,
 fileEncoding = "UTF-8")

names(datos)

## [1] "Tipo_Proveedor"     "Pedidos_Realizados" "Tiempo_Envio_Dias" 
## [4] "Costo_Envio"

dim(datos)

## [1] 100   4

table(datos$Tipo_Proveedor)

## 
## Internacional         Local      Nacional 
##            26            32            42

str(datos)

## 'data.frame':    100 obs. of  4 variables:
##  $ Tipo_Proveedor    : chr  "Local" "Internacional" "Nacional" "Internacional" ...
##  $ Pedidos_Realizados: int  16 11 12 20 38 42 39 15 44 15 ...
##  $ Tiempo_Envio_Dias : num  5.7 3.5 4.4 6.6 9.6 5.2 9.3 6.2 8 4.5 ...
##  $ Costo_Envio       : num  279 489 268 141 391 ...

barplot(sort(table(datos$Tipo_Proveedor),decreasing=TRUE),
 las=2)

summary(datos)

##  Tipo_Proveedor     Pedidos_Realizados Tiempo_Envio_Dias  Costo_Envio    
##  Length:100         Min.   : 7.00      Min.   : 1.50     Min.   : 50.04  
##  Class :character   1st Qu.:15.00      1st Qu.: 4.75     1st Qu.:143.40  
##  Mode  :character   Median :25.50      Median : 8.25     Median :282.56  
##                     Mean   :27.48      Mean   : 8.14     Mean   :271.01  
##                     3rd Qu.:41.00      3rd Qu.:11.22     3rd Qu.:375.64  
##                     Max.   :48.00      Max.   :15.00     Max.   :494.13

La mediana (8.25) y la media (8.14) están muy cercanas, lo que sugiere que la distribución de los tiempos es aproximadamente simétrica. Hay una variabilidad en los tiempos, con valores que oscilan entre 1.50 y 15.00. El rango intercuartílico (Q3 - Q1) es 11.22 - 4.75 = 6.47, lo que indica que la mayor parte de los datos se encuentra en ese rango.

Gráficos Descriptivos

library(ggplot2)
ggplot(datos, aes(x = Tipo_Proveedor, y = Pedidos_Realizados, fill = Tipo_Proveedor)) +
  geom_boxplot() +
  labs(title = "Distribución de pedidos por proveedor",
       x = "Proveedor",
       y = "Pedidos realizados") +
  theme_minimal()

Este gráfico muestra la variabilidad en los pedidos realizados hacia cada proveedor. Se pueden observar diferencias en la mediana y similitudes en la dispersión de los datos.

library(ggplot2)
ggplot(data = datos, aes(x=Tipo_Proveedor, y=Costo_Envio)) + geom_bar(stat="identity")+labs(title = "Distribución de Tipo de Proveedor por Costo de Envio", x= "Tipo de Proveedor", y= "Costo de Envio")

Los proveedores nacionales tienen el mayor costo de envío acumulado, seguidos por los locales e internacionales, lo que indica que los proveedores internacionales son menos costosos en promedio. Sin embargo, la primera gráfica muestra que la mayoría de los pedidos se realizan a proveedores nacionales, lo que podría estar alterando el costo de entrega debido a una mayor demanda o procesos logísticos.

library(ggplot2)
ggplot(data = datos, aes(x = Tiempo_Envio_Dias)) +
  geom_histogram(binwidth = 1, fill = "skyblue", color = "black", alpha = 0.8) +
  labs(title = "Histograma de Tiempo de Envio",
       x = "Tiempo de Envio en Dias",
       y = "Frecuencia")

El histograma muestra que los tiempos de envío varían entre 2 y 15 días, con varios picos en diferentes rangos, lo que sugiere una distribución multimodal. Los tiempos más comunes están entre 3-5 y 10-12 días, indicando posibles diferencias entre proveedores

Estimaciones Estadísticas

1. Estimación de la Media

La empresa JJK quiere determinar el costo medio de envío de sus productos para optimizar su estructura de precios y estrategias de distribución. Para ello, selecciona una muestra aleatoria de 32 pedidos y registra el costo de envío de cada uno.

Dado que el costo de envío influye en la rentabilidad y satisfacción del cliente ¿Cuál es la media del costo de envío, teniendo en cuenta que su intervalo de confianza es del 95%?

datos_L <- filter(datos, Tipo_Proveedor == "Local")
datos_L

##    Tipo_Proveedor Pedidos_Realizados Tiempo_Envio_Dias Costo_Envio
## 1           Local                 16               5.7      279.07
## 2           Local                 38               9.6      390.66
## 3           Local                 42               5.2      282.06
## 4           Local                 44               8.0       72.41
## 5           Local                 15               4.5      331.54
## 6           Local                 15               9.3      472.41
## 7           Local                 45               1.6      233.02
## 8           Local                  8               5.0      478.92
## 9           Local                 28               4.5      408.10
## 10          Local                 15               7.2       52.86
## 11          Local                 22               4.3      412.91
## 12          Local                 10              14.5       64.23
## 13          Local                 47               2.5      186.67
## 14          Local                 23               4.0      371.83
## 15          Local                 22               8.8      315.58
## 16          Local                 47              10.0      318.53
## 17          Local                 10               7.7      241.21
## 18          Local                 36              12.2      193.59
## 19          Local                 15               3.7      419.72
## 20          Local                 35               5.9      142.27
## 21          Local                 28               1.8      148.40
## 22          Local                 11               4.6      270.59
## 23          Local                 47               3.4      241.13
## 24          Local                 18               4.1      264.20
## 25          Local                 30               7.5      315.61
## 26          Local                 11              11.9      397.67
## 27          Local                 31              14.7      311.66
## 28          Local                 32              14.2      375.51
## 29          Local                 43              12.8      315.42
## 30          Local                 48              11.2      450.19
## 31          Local                 42               8.6      277.67
## 32          Local                 13               9.9      125.35

media_costo_L <- mean(datos_L$Costo_Envio)  
sd_costo_L <- sd(datos_L$Costo_Envio)  
n_L <- nrow(datos_L)  
error_media_L <- qt(0.975, df = n_L - 1) * sd_costo_L / sqrt(n_L)  


IC_media_L <- c(media_costo_L - error_media_L, media_costo_L + error_media_L)
cat("Media de Costo de Envio:", media_costo_L, "\n")

## Media de Costo de Envio: 286.2809

cat("Intervalo de confianza para la media poblacional del costo de envio en los proveedores locales:", IC_media_L, "\n")

## Intervalo de confianza para la media poblacional del costo de envio en los proveedores locales: 243.638 328.9239

Se estimó que el costo medio de envío con proveedores locales es de 286.28, y con un 95% de confianza, se encuentra entre 243.64 y 328.92. Este intervalo permite tener una idea del rango en el que se mueve el costo promedio de envío, útil para tomar decisiones relacionadas con precios y distribución. La empresa puede usar esta información para evaluar si los costos actuales son sostenibles y si es necesario ajustar su estrategia logística o comparar con otros tipos de proveedores.

2. Estimación de la Proporción

Un minorista en línea busca evaluar la dependencia de su cadena de suministro en proveedores locales. La gerencia SNK quiere determinar qué porcentaje de los pedidos realizados provienen de proveedores locales para evaluar si es necesario diversificar sus fuentes de abastecimiento. Para ello, toman una muestra aleatoria de 2,748 pedidos y registran si fueron atendidos por proveedores locales o no.

Dado que la proporción de pedidos locales es un indicador clave en la estrategia de abastecimiento ¿Cuál es la proporción de pedidos realizados a proveedores locales, teniendo en cuenta que su intervalo de confianza es del 95%?

num_pedidos_L <- sum(datos_L$Pedidos_Realizados)

n_L <- sum(datos$Pedidos_Realizados)
p_L <- num_pedidos_L / n_L  
error_p_L <- qnorm(0.975) * sqrt((p_L * (1 - p_L)) / n_L)
IC_p_L <- c(p_L - error_p_L, p_L + error_p_L)

cat("Cantidad de Pedidos Realizados con proveedores locales:", num_pedidos_L, "\n")

## Cantidad de Pedidos Realizados con proveedores locales: 887

cat("Tamaño de la muestra (n):", n_L, "\n")

## Tamaño de la muestra (n): 2748

cat("Tamaño de la muestra (n):", IC_p_L, "\n")

## Tamaño de la muestra (n): 0.3052995 0.3402609

cat("Proporción muestral de pedidos realizados en la muestra fue de:", round(p_L, 4), "\n")

## Proporción muestral de pedidos realizados en la muestra fue de: 0.3228

cat("Intervalo de confianza (95%) de la población de clientes satisfechos esta entre:", round(IC_p_L [1], 4), "y", round(IC_p_L [2], 4), "\n")

## Intervalo de confianza (95%) de la población de clientes satisfechos esta entre: 0.3053 y 0.3403

La proporción muestral de pedidos realizados a proveedores locales fue de 0.3228, lo que indica que aproximadamente el 32.28% de los pedidos en la muestra provinieron de este tipo de proveedor. Con un 95% de confianza, se estima que la proporción real de pedidos locales en toda la población se encuentra entre 30.53% y 34.03%. Esta información es útil para que la gerencia de SNK evalúe el grado de dependencia en proveedores locales y considere si es necesario diversificar su cadena de suministro.

3. Estimación de Varianza

Para optimizar sus costos logísticos, la empresa CG necesita evaluar qué tan consistentes son los costos de envío de sus proveedores locales. Si la variabilidad es alta, podrían considerar renegociar tarifas o buscar opciones más estables. Para ello, seleccionan una muestra de pedidos enviados a través de proveedores locales (32) y registran el costo de envío de cada uno.

Dado que la estabilidad en los costos de envío es clave para la planificación financiera ¿Cuál es la varianza muestral del costo de envío en los proveedores locales, teniendo en cuenta que su intervalo de confianza es del 95%?

varianza_L <- var(datos_L$Costo_Envio)  
n_L <- nrow(datos_L)  
gl <- n_L - 1  
chi2_inf <- qchisq(0.975, df = gl)  
chi2_sup <- qchisq(0.025, df = gl)  
IC_varianza_L <- c((gl * varianza_L) / chi2_inf, (gl * varianza_L) / chi2_sup)



cat("Varianza muestral del Costo de Envio en los Proveedores Locales:", round(varianza_L, 4), "\n")

## Varianza muestral del Costo de Envio en los Proveedores Locales: 13989.17

cat("Intervalo de confianza (95%) para la varianza de Costo poblacionales:", round(IC_varianza_L[1], 4), "a", round(IC_varianza_L[2], 4), "\n")

## Intervalo de confianza (95%) para la varianza de Costo poblacionales: 8991.234 a 24726.08

cat("Varianza muestral del Costo de Envio en los Proveedores Locales:", round(n_L, 4), "\n")

## Varianza muestral del Costo de Envio en los Proveedores Locales: 32

La varianza muestral del costo de envío con proveedores locales fue de 13,989.17, lo que indica una dispersión considerable en los costos observados. Con un 95% de confianza, se estima que la varianza real en la población se encuentra entre 8,991.23 y 24,726.08. Esta amplitud sugiere una variabilidad significativa en los costos de envío, lo que podría dificultar la planificación financiera. La empresa CG puede considerar revisar las causas de esta variabilidad y evaluar opciones como renegociar tarifas o explorar proveedores con costos más estables.

4. Diferencia de Medias

Una empresa de logística desea evaluar si existe una diferencia significativa en el costo de envío entre proveedores locales e internacionales. Para ello, selecciona una muestra aleatoria de 32 envíos de proveedores locales y 26 envíos de proveedores internacionales, registrando el costo de cada envío en dólares.

Dado que es necesario comparar el costo promedio de envío entre proveedores locales e internacionales para mejorar el área presupuestal de la compañía, ¿Cuál es la diferencia entre los costos de envío medio entre proveedores locales e internacionales con un intervalo de confianza del 95%?

datos_I <- filter(datos, Tipo_Proveedor == "Internacional")
datos_I

##    Tipo_Proveedor Pedidos_Realizados Tiempo_Envio_Dias Costo_Envio
## 1   Internacional                 11               3.5      488.87
## 2   Internacional                 20               6.6      141.31
## 3   Internacional                 39               9.3      264.86
## 4   Internacional                 15               6.2      348.51
## 5   Internacional                 14               7.7      333.75
## 6   Internacional                 22               8.9      301.86
## 7   Internacional                 22              11.2       66.91
## 8   Internacional                 48               7.5       50.04
## 9   Internacional                 12               9.1       55.25
## 10  Internacional                 33               5.2      325.52
## 11  Internacional                 32               1.5      212.07
## 12  Internacional                 19              13.1      116.68
## 13  Internacional                 45              10.5      114.15
## 14  Internacional                 25               4.9       89.71
## 15  Internacional                 43               7.6      441.03
## 16  Internacional                 43              12.5      304.32
## 17  Internacional                 16              11.3      214.15
## 18  Internacional                 35               9.8      346.10
## 19  Internacional                 48               5.0      398.56
## 20  Internacional                 19               6.9      487.30
## 21  Internacional                  7              12.0       56.75
## 22  Internacional                 11              14.0      382.76
## 23  Internacional                 27               5.1       93.87
## 24  Internacional                 24              11.8      395.18
## 25  Internacional                 25              10.1      255.75
## 26  Internacional                 41               5.9      272.09

media_local <- mean(datos_L$Costo_Envio)
media_internacional <- mean(datos_I$Costo_Envio)

sd_local <- sd(datos_L$Costo_Envio)
sd_internacional <- sd(datos_I$Costo_Envio)

n_local <- 32
n_internacional <- 26

diff_medias <- media_local - media_internacional

error_diff <- sqrt((sd_local^2 / n_local) + (sd_internacional^2 / n_internacional))

df_welch <- ((sd_local^2 / n_local + sd_internacional^2 / n_internacional)^2) /
            (((sd_local^2 / n_local)^2 / (n_local - 1)) + ((sd_internacional^2 / n_internacional)^2 / (n_internacional - 1)))


t_critico <- qt(0.975, df = df_welch)


IC_diff_medias <- c(diff_medias - t_critico * error_diff, diff_medias + t_critico * error_diff)


cat("Media de costo de envio para proveedores locales:", round(media_local, 2), "\n")

## Media de costo de envio para proveedores locales: 286.28

cat("Media de costo de envio para proveedores internacionales:", round(media_internacional, 2), "\n")

## Media de costo de envio para proveedores internacionales: 252.21

cat("Diferencia de medias:", round(diff_medias, 2), "\n")

## Diferencia de medias: 34.08

cat("Intervalo de confianza (95%) para la diferencia de medias de costo de envio entre proveedores locales e internacionales es de:", round(IC_diff_medias[1], 2), "a", round(IC_diff_medias[2], 2), "\n")

## Intervalo de confianza (95%) para la diferencia de medias de costo de envio entre proveedores locales e internacionales es de: -35.65 a 103.8

Se concluye que los proveedores locales tienen un costo de envío significativamente más alto que los proveedores internacionales, con una diferencia promedio de $34.07, y un intervalo de confianza del 95% entre $-35.65 y $103.8. Entonces, no hay evidencia suficiente información para poder concluir que existe una diferencia significativa en los proveedores debido a que el 0 esta incluido en el rango.

5. Diferencia de Proporciones

La empresa desea evaluar si la proporción de envíos rápidos (≤5 días) es significativamente diferente entre proveedores locales e internacionales. Para ello, se selecciona una muestra de envíos realizados por 32 proveedores locales y 26 proveedores internacionales.

En este caso, ¿Cuál es la diferencia de proporciones entre los envíos rápidos de proveedores locales e internacionales, tomando un intervalo de confianza del 95%?

datos_rlocales <- filter(datos, Tipo_Proveedor == "Local")
datos_rinternacionales <- filter(datos, Tipo_Proveedor == "Internacional")
umbral_envios <- 5

num_rapidos_local <- sum(datos_rlocales$Tiempo_Envio_Dias <= umbral_envios)
num_rapidos_internacional <- sum(datos_rinternacionales$Tiempo_Envio_Dias <= umbral_envios)

p_local <- num_rapidos_local/ nrow(datos_rlocales)
p_internacional <- num_rapidos_internacional/ nrow(datos_rinternacionales)


diff_proporciones <- p_local - p_internacional

error_diff_p <- sqrt((p_local* (1 - p_local) / nrow(datos_L)) + (p_internacional * (1 - p_internacional) / nrow(datos_I)))

z_critico <- qnorm(0.975)  

IC_diff_proporciones <- c(diff_proporciones - z_critico * error_diff_p, 
                           diff_proporciones + z_critico * error_diff_p)

total_locales <- nrow(datos_rlocales)
total_internacionales <- nrow(datos_rinternacionales)

cat("Proporción de Envios rápidos a nivel local:", round(p_local, 4), "\n")

## Proporción de Envios rápidos a nivel local: 0.375

cat("Proporción de clientes Envios rápidos a nivel internacional:", round(p_internacional, 4), "\n")

## Proporción de clientes Envios rápidos a nivel internacional: 0.1538

cat("Diferencia de proporciones:", round(diff_proporciones, 4), "\n")

## Diferencia de proporciones: 0.2212

cat("Intervalo de confianza (95%):", round(IC_diff_proporciones[1], 4), "a", round(IC_diff_proporciones[2], 4), "\n")

## Intervalo de confianza (95%): 0.0035 a 0.4388

Existe una diferencia significativa entre las proporciones de envíos rápidos (≤5 días) de proveedores locales e internacionales. Esta diferencia está respaldada por un intervalo de confianza del 95% entre 0.35% y 43.88%, lo que sugiere que, en promedio, los proveedores locales tienen mejor desempeño en velocidad de entrega. Se recomienda que esta diferencia sea tenida en cuenta en las decisiones de selección de proveedores, sobre todo en contextos donde la rapidez del servicio sea prioritaria.

6. Razón de Varianza

El departamento de finanzas de una empresa de comercio internacional está evaluando la estabilidad en los costos de envío de los proveedores. Una alta variabilidad en los costos de envío puede representar incertidumbre financiera y afectar la planificación presupuestaria. Se desea comparar la variabilidad en los costos de envío entre los proveedores nacionales e internacionales, entonces, Con un intervalo de confianza del 95%

¿Cuál es la razón de varianzas de los costos de envío entre proveedores nacionales e internacionales?

datos_nacionales <- filter(datos, Tipo_Proveedor == "Nacional")
datos_internacionales <- filter(datos, Tipo_Proveedor == "Internacional")

var_nacionales <- var(datos_nacionales$Costo_Envio)
var_internacionales <- var(datos_internacionales$Costo_Envio)

n_nacionales <- nrow(datos_nacionales)
n_internacionales <- nrow(datos_internacionales)

costos_nacional <- datos_nacionales$Costo_Envio
costos_internacional <- datos_internacionales$Costo_Envio


F_stat <- var_nacionales / var_internacionales


F_inf <- qf(0.975, df1 = n_nacionales-1, df2 = n_internacionales-1)  
F_sup <- qf(0.025, df1 = n_nacionales-1, df2 = n_internacionales-1)  


IC_F <- c(F_stat / F_inf, F_stat * F_sup)

cat("Varianza muestral costos de proveedores nacionales:", round(var_nacionales, 4), "\n")

## Varianza muestral costos de proveedores nacionales: 19632.58

cat("Varianza muestral en costos de proveedores internacionales:", round(var_internacionales, 4), "\n")

## Varianza muestral en costos de proveedores internacionales: 19926.51

cat("Razón de varianzas (Proveedor nacional / Proveedor internacional):", round(F_stat, 4), "\n")

## Razón de varianzas (Proveedor nacional / Proveedor internacional): 0.9852

cat("Intervalo de confianza (95%):", round(IC_F[1], 4), "a", round(IC_F[2], 4), "\n")

## Intervalo de confianza (95%): 0.4662 a 0.4963

Con un intervalo de confianza del 95%, se concluye que existe una diferencia significativa en la variabilidad de los costos de envío entre proveedores nacionales e internacionales. Específicamente, la variabilidad en los costos de los proveedores nacionales es menor que la de los internacionales. La razón de varianzas es 0.9852, y el intervalo de confianza va de 0.4662 a 0.4963, lo que indica que esta diferencia es estadísticamente significativa. Esta menor variabilidad sugiere que los proveedores nacionales presentan mayor estabilidad en sus costos de envío, lo cual es un factor favorable desde el punto de vista de la gestión financiera y planificación presupuestaria.

Pruebas de Hipótesis

1. Prueba de Hipótesis Media

Una empresa de logística en Colombia ha establecido como estándar que el tiempo promedio de envío de sus proveedores que debe ser los 9 días. Para evaluar si los proveedores están cumpliendo con este estándar, el gerente de calidad toma una muestra de envíos recientes y registra el tiempo que tardaron en llegar.

tiempos <- datos$Tiempo_Envio_Dias

n <- length(tiempos)
media_muestral <- mean(tiempos)
desviacion <- sd(tiempos)
error_estandar <- desviacion / sqrt(n)

media_hipotesis <- 9
nivel_significancia <- 0.05

t_calculado <- (media_muestral - media_hipotesis) / error_estandar

gl <- n - 1

error_margin <- qt(1 - nivel_significancia / 2, df = gl) * error_estandar
ic_inf <- media_muestral - error_margin
ic_sup <- media_muestral + error_margin

p_valor <- 2 * (1 - pt(abs(t_calculado), df = gl))

cat("Media muestral:", media_muestral, "\n")

## Media muestral: 8.14

cat("Desviación estándar:", desviacion, "\n")

## Desviación estándar: 3.868991

cat("Estadístico t:", t_calculado, "\n")

## Estadístico t: -2.222802

cat("p-valor:", p_valor, "\n")

## p-valor: 0.02850406

cat("Intervalo de confianza 95%: [", ic_inf, ",", ic_sup, "]\n")

## Intervalo de confianza 95%: [ 7.372308 , 8.907692 ]

Debido a que se rechaza la hipotesis nula µ=9 entonces se concluye que el tiempo de espera en días promedio debe ser diferente de 9 días.

2. Prueba Hipótesis Proporción

La empresa Logística Global S.A.S. trabaja con distintos tipos de proveedores: locales, nacionales e internacionales. La gerencia cree que menos del 40% de sus proveedores son internacionales, lo cual les preocupa porque están buscando mayor diversificación global para mejorar su competitividad.

Para comprobar esta sospecha, toman una muestra de los registros de proveedores recientes y se preguntan ¿Es significativamente menor al 40% la proporción de proveedores internacionales en nuestra muestra?

binaria <- ifelse(datos$Tipo_Proveedor == "Internacional", 1, 0)

n <- length(binaria)                   # tamaño muestra
x <- sum(binaria)                     # éxitos (proveedores internacionales)
p_muestral <- x / n                   # proporción muestral
p_hipotesis <- 0.40                   # proporción bajo H₀

error_estandar <- sqrt(p_hipotesis * (1 - p_hipotesis) / n)

z <- (p_muestral - p_hipotesis) / error_estandar

p_valor <- pnorm(z)

cat("Proporción muestral:", p_muestral, "\n")

## Proporción muestral: 0.26

cat("Estadístico Z:", z, "\n")

## Estadístico Z: -2.857738

cat("p-valor:", p_valor, "\n")

## p-valor: 0.002133362

Debido a que se rechaza la hipótesis nula p≥40% entonces se concluye que la proporción de de proveedores internacionales es menor que el 40%, por lo tanto, la empresa debera mejorar su cartera de proveedores para mejorar su competitividad.

3. Prueba de Hipótesis Varianza

La empresa Envía Rápido S.A. está evaluando la eficiencia y consistencia en los tiempos de entrega de sus proveedores. Según sus estándares de calidad, la varianza aceptable del tiempo de envío no debe superar los 4 días², ya que una alta dispersión en los tiempos genera incertidumbre en sus procesos logísticos.

El jefe de operaciones sospecha que algunos proveedores no están siendo consistentes y propone la siguiente pregunta: ¿La varianza de los tiempos de envío de nuestros proveedores es significativamente mayor que 4 días²?

n <- length(tiempos)
var_muestral <- var(tiempos)
var_hipotesis <- 11  

chi2 <- (n - 1) * var_muestral / var_hipotesis

p_valor <- pchisq(chi2, df = n - 1, lower.tail = FALSE)

alpha <- 0.05
gl <- n - 1
chi2_inf <- qchisq(1 - alpha/2, df = gl)
chi2_sup <- qchisq(alpha/2, df = gl)

ic_varianza_inf <- (gl * var_muestral) / chi2_inf
ic_varianza_sup <- (gl * var_muestral) / chi2_sup

cat("Varianza muestral:", var_muestral, "\n")

## Varianza muestral: 14.96909

cat("Estadístico Chi-cuadrado:", chi2, "\n")

## Estadístico Chi-cuadrado: 134.7218

cat("p-valor (cola derecha):", p_valor, "\n")

## p-valor (cola derecha): 0.009876688

cat("Intervalo de confianza 95% para la varianza: [", ic_varianza_inf, ",", ic_varianza_sup, "]\n")

## Intervalo de confianza 95% para la varianza: [ 11.53961 , 20.20063 ]

Debido a que se rechaza la hipótesis nula entonces se puede concluir que la variabilidad en los tiempos de envío de los proveedores es significativamente mayor de lo aceptado (más de 4 días²), afectando la consistencia del servicio logístico.

4. Prueba de hipótesis para dos medias.

La gerencia de Logística Nacional S.A.S. desea identificar si hay diferencias operativas entre proveedores locales y nacionales. Se sospecha que los proveedores locales podrían estar gestionando una menor cantidad de pedidos que los nacionales, lo cual podría reflejar menor capacidad de respuesta.

En una muestra de 32 proveedores locales y 42 proveedores nacionales, se observó que los locales realizaron en promedio 27.72 pedidos, mientras que los nacionales realizaron 27.74.

La empresa se pregunta:Con un nivel de significancia del 5%, ¿Es significativamente menor el número promedio de pedidos realizados por los proveedores locales en comparación con los proveedores nacionales?

n_locales <- 32
n_nacionales <- 42
alfa <- 0.05

x_barra_locales <- 27.72
x_barra_nacionales <- 27.74

pedidos_L <- datos_L$Pedidos_Realizados

desv_locales <- sd(pedidos_L)
desv_nacionales <- sd(datos_nacionales$Pedidos_Realizados)

var_locales <- desv_locales^2
var_nacionales <- desv_nacionales^2

#Planteamiento de hipótesis
# Ho = media_local - media_nacioal ≥ 0
# Hi = media_local - media_nacional < 0 

z_cal_num <- (x_barra_locales - x_barra_nacionales)- 0
z_cal_df <- sqrt((var_locales / n_locales)+(var_nacionales / n_nacionales))
z_cal <- z_cal_num / z_cal_df

z_critico <- qnorm(0.95)

#Regla de decisión
#Dado que -0.0064 > -1.64, entonces, se acepta la hipótesis nula

#Pvalor
p_valor <- pnorm(z_cal)
#Dado que p_valor > alfa(0.05), entonces, se acepta la hipótesis nula

Con un nivel de significancia del 5%, dado que se acepta la hipótesis nula, se puede rechazar la alternativa a nivel poblacional de que el promedio de los pedidos realizados por los proveedores locales es menor a la de los proveedores nacionales

5. Prueba de hipótesis para diferencia de proporciones

La empresa Logística Global S.A.S. desea evaluar si existe una diferencia significativa en la proporción de entregas puntuales (definidas como entregas de 5 días o menos) entre proveedores locales y nacionales.

En una muestra, se encontró que:

- De 32 proveedores locales, 20 cumplieron con la entrega en 5 días o menos.

- De 42 proveedores nacionales, 34 cumplieron con la entrega en 5 días o menos.

Con un nivel de significancia del 5%, ¿Es significativamente mayor la proporción de entregas puntuales entre los proveedores nacionales que entre los locales?

n_locales <- 32
n_nacionales <- 42
alfa <- 0.05

prop_nacionales <- 34 / 42
prop_locales <- 20 / 32
prop_asumida <- ((n_locales * prop_locales) + (n_nacionales * prop_nacionales)) / (n_locales + n_nacionales)

#Planteamiento de hipótesis
# Ho = prop_locales - prop_nacionales ≥ 0
# Hi = prop_locales -  prop_nacionales < 0

z_cal_num <- n_locales - n_nacionales
comp_p0 <- prop_asumida * (1 - prop_asumida)
z_cal_df <- sqrt( (comp_p0 / n_nacionales) + (comp_p0 / n_locales) )
z_cal <- z_cal_num / z_cal_df
z_critico <- qnorm(0.95)

#Regla de decisión
# Dado que -95.96 < -1.64, entonces, se rechaza la hipótesis nula.

#Pvalor
p_valor <- pnorm(z_cal)
#Dado que p_valor < alfa(0.05), entonces, se rechaza la hipótesis nula

Con un nivel de significancia del 5%, dado que se rechaza la hipótesis nula, se puede afirmar a nivel poblacional que la proporción de envíos puntuales de los proveedores nacionales es mayor a la de los proveedores locales

6. Prueba de hipótesis para razón de la varianza

Se desea verificar si la varianza en el tiempo de entrega es igual entre proveedores locales y nacionales, como parte de una evaluación de consistencia operativa. A partir de las muestras:

Locales: 32 observaciones

Nacionales: 42 observaciones

Con un nivel de significancia del 5%, ¿Es razonable asumir que la varianza de los tiempos de entrega entre proveedores locales y nacionales es igual?

n_locales <- 32
n_nacionales <- 42
alfa <- 0.05

Tiempo_L <- datos_L$Tiempo_Envio_Dias
Tiempo_N <- datos_nacionales$Tiempo_Envio_Dias

desv_locales <- sd(Tiempo_L)
desv_nacionales <- sd(Tiempo_N)

var_locales <- desv_locales^2
var_nacionales <- desv_nacionales^2

#Planteamiento de Hipótesis
# Ho = var_locales = var_nacionales
# Hi = var_locales ≠ var_nacionales

f_cal <- var_nacionales / var_locales
f_crítico <- qf(0.025, 41, 31, lower.tail = FALSE)
f_crítico_comp <- qf(0.9750, 41, 31, lower.tail = FALSE)

#Regla de decisión
#Dado que 1.25 < 1.98, entonces, no se rechaza la hipótesis nula

#Pvalor
p_valor <- pf(f_cal, 41, 31, lower.tail = FALSE)
#Dado que p_valor > alfa(0.05), no se rechaza la hipótesis nula

Con un nivel de significancia del 5%, dado que se acepta la hipótesis nula, a nivel poblacional se puede afirmar que la varianza de los tiempos de entrega entre proveedores nacionales y locales son iguales

Taller #1 Estimaciones - Estadistica II

Sebastian Hernandez - Reinaldo Galvis

2025-03-11