| Nacionalidad | Promedio | Mediana | Desviación_Estándar | Varianza | Mínimo | Máximo |
|---|---|---|---|---|---|---|
| ALE | 1684.98 | 1545.0 | 1020.56 | 1041536.26 | 100 | 10988 |
| ARG | 1967.11 | 1337.0 | 1316.15 | 1732240.94 | 1025 | 5800 |
| AUS | 173.35 | 186.0 | 37.73 | 1423.62 | 52 | 229 |
| BRA | 2731.91 | 1375.0 | 2226.71 | 4958249.73 | 98 | 10700 |
| CAN | 1818.95 | 1948.0 | 346.36 | 119963.85 | 1197 | 2500 |
| CHI | 1809.97 | 1510.0 | 1723.20 | 2969432.97 | 60 | 14400 |
| CHL | 1353.46 | 1280.0 | 264.35 | 69881.22 | 980 | 1850 |
| COL | 1802.12 | 1273.0 | 1547.36 | 2394319.25 | 58 | 9650 |
| CZE | 1146.87 | 1117.5 | 174.37 | 30405.72 | 148 | 1551 |
| ECU | 1519.89 | 1550.0 | 303.37 | 92031.55 | 800 | 2400 |
| ENG | 1535.15 | 1645.0 | 818.13 | 669338.89 | 100 | 3240 |
| ESP | 1212.19 | 1121.0 | 746.85 | 557787.45 | 118 | 7800 |
| FRA | 1721.03 | 1314.0 | 1483.30 | 2200179.86 | 780 | 10732 |
| HNG | 1326.48 | 1280.0 | 185.32 | 34343.40 | 1075 | 1730 |
| IDN | 1313.00 | 1905.0 | 1047.10 | 1096417.00 | 104 | 1930 |
| IND | 850.39 | 765.0 | 873.05 | 762216.84 | 95 | 3925 |
| ITA | 647.93 | 189.0 | 1158.22 | 1341463.76 | 68 | 9530 |
| JAP | 1644.92 | 1489.0 | 1260.66 | 1589273.72 | 55 | 9795 |
| KOR | 1853.82 | 1471.0 | 1645.30 | 2707013.13 | 56 | 14470 |
| MEX | 2489.24 | 1395.0 | 2200.72 | 4843158.92 | 155 | 15422 |
| NED | 9317.00 | 9317.0 | 0.00 | 0.00 | 9317 | 9317 |
| RUM | 1415.71 | 1250.0 | 327.25 | 107095.24 | 1180 | 2000 |
| RUS | 9955.45 | 8225.0 | 11006.62 | 121145722.27 | 1250 | 41000 |
| SUE | 1938.45 | 1577.0 | 1500.78 | 2252351.33 | 1054 | 9740 |
| TAI | 1738.86 | 1830.0 | 445.59 | 198548.20 | 146 | 2750 |
| TWN | 128.83 | 109.5 | 41.91 | 1756.67 | 80 | 234 |
| USA | 2262.39 | 1841.0 | 1684.81 | 2838576.02 | 136 | 15000 |
| VEN | 2016.45 | 1764.0 | 1317.65 | 1736209.04 | 700 | 7767 |
Prueba de Hipótesis sobre las Características de Vehículos en Colombia: Peso, Potencia, Nacionalidad y Clase
Datos
Los datos analizados provienen de una base de vehículos en Colombia que incluye las siguientes variables:
| Variable | Tipo | Subtipo | Escala |
|---|---|---|---|
| Nacionalidad | Cualitativa | Nominal | Nominal |
| Clase | Cualitativa | Nominal | Nominal |
| Peso | Cuantitativa | Continua | Razón |
| Potencia | Cuantitativa | Continua | Razón |
Hipótesis planteadas
Hipótesis 1:El gerente general de la compañía desea analizar si existen diferencias significativas en las características de peso de los vehículos según su nacionalidad (KOR y TAI) y su clase (CAMIONETA PASAJ y CAMIONETA REPAR). Este análisis busca evaluar tanto la media como la variabilidad en el peso de los vehículos, con el fin de entender si la procedencia y el tipo de vehículo influyen en estas características.
Hipótesis 2: El gerente general desea analizar si existen diferencias significativas en la proporción de vehículos con peso superior a un valor de referencia (en este caso, 1500 kg), según las categorías “CAMIONETA PASAJ.” y “CAMIONETA REPAR.” así como las nacionalidades “KOR” y “TAI”. El objetivo de este análisis es determinar si la clase del vehículo (CAMIONETA PASAJ. y CAMIONETA REPAR.) y la nacionalidad (KOR y TAI) influyen en la proporción de vehículos que superan un peso crítico.
Hipótesis 3: El departamento de investigación desea analizar si existen diferencias significativas en la potencia de los vehículos, tanto en la media como en la variabilidad, según la nacionalidad (KOR o TAI) y la clase del vehículo (CAMIONETA PASAJ. y CAMIONETA REPAR.). Se utilizarán pruebas de hipótesis para comparar las medias de potencia entre nacionalidades y las varianzas de potencia entre clases, con el objetivo de determinar si estas variables influyen significativamente en la potencia de los vehículos.
Hipótesis 4: El departamento de investigación de la empresa busca analizar si existen diferencias significativas en la proporción de vehículos con Potencia superior a 150 entre distintos grupos. Se compararán las proporciones de vehículos con alta potencia según la Nacionalidad (KOR y TAI) y la Clase del vehículo (CAMIONETA PASAJ. y CAMIONETA REPAR.). El objetivo es determinar si estas variables influyen en la proporción de vehículos con alta potencia.
Estadísticas Descriptivas de Variables Cuantitativas
Peso
Potencia
| Clase | Promedio | Mediana | Desviación_Estándar | Varianza | Mínimo | Máximo |
|---|---|---|---|---|---|---|
| AUTOMOVIL | 150.39 | 122 | 86.48 | 7478.95 | 36 | 662 |
| BUS / BUSETA / MICROBUS | 150.60 | 140 | 58.16 | 3382.05 | 50 | 420 |
| CAMION | 149.99 | 135 | 61.45 | 3776.30 | 47 | 394 |
| CAMIONETA PASAJ. | 165.66 | 153 | 75.18 | 5651.34 | 39 | 585 |
| CAMIONETA REPAR | 94.80 | 87 | 34.32 | 1177.66 | 39 | 205 |
| CAMPERO | 202.41 | 180 | 81.78 | 6688.07 | 45 | 567 |
| CARROTANQUE | 182.90 | 173 | 56.75 | 3220.99 | 92 | 340 |
| CHASIS | 171.96 | 141 | 78.53 | 6166.40 | 47 | 440 |
| FURGON | 139.29 | 126 | 52.97 | 2805.76 | 47 | 400 |
| MOTOCARRO | 17.94 | 14 | 13.65 | 186.33 | 7 | 54 |
| MOTOCICLETA | 42.97 | 15 | 48.45 | 2347.43 | 3 | 207 |
| PICKUP DOBLE CAB | 166.69 | 141 | 83.82 | 7025.48 | 47 | 420 |
| PICKUP SENCILLA | 144.67 | 120 | 74.86 | 5604.47 | 41 | 385 |
| REMOLCADOR | 359.19 | 400 | 87.01 | 7570.94 | 190 | 480 |
| VOLQUETA | 251.76 | 240 | 89.48 | 8006.79 | 95 | 440 |
Análisis de Normalidad
Peso
- Conclusión: Las gráficas sugieren que hay diferencias en la distribución del peso entre los países KOR y TAI, siendo el país KOR el que presenta un peso promedio ligeramente mayor y una mayor variabilidad. Además, los datos de ambos países no siguen una distribución normal.
Potencia
- Conclusión: Las gráficas sugieren que hay diferencias en la distribución de la potencia entre las camionetas de pasajeros y de reparto, siendo las camionetas de pasajeros las que presentan una potencia promedio ligeramente mayor y una mayor variabilidad. Además, los datos de ambas clases no siguen una distribución normal.
Boxplot Comparativos
Peso vs Nacionalidad
KOR TAI
815 73
- Conclusión: Los datos sugieren que existen diferencias en la distribución de la potencia entre los vehículos coreanos y tailandeses, siendo los coreanos los que presentan una potencia promedio mayor y una mayor variabilidad.
Potencia vs Clase
- conclusión: El boxplot muestra claramente que existe una diferencia significativa en la potencia promedio entre las camionetas de pasajeros y de reparto. Las primeras tienden a tener motores más potentes, aunque también presentan una mayor variabilidad en la potencia.
Prueba de hipótesis para la Media y Varianza del Peso general
En esta sección realizamos pruebas para determinar si existen diferencias significativas en la media y la varianza del peso de los vehículos en el conjunto de datos.
- Parámetro de interés: la media y la varianza del peso de los vehículos.
- Hipótesis:
- Para la media:
- H₀: La media del peso es igual a un valor de referencia.
- H₁: La media del peso es diferente al valor de referencia.
- Para la varianza:
- H₀: La varianza del peso es igual a un valor de referencia.
- H₁: La varianza del peso es diferente al valor de referencia.
- Para la media:
- Nivel de significancia: 0.05.
- Pruebas utilizadas:
- Para la media: Prueba t de Student.
- Para la varianza: Prueba Chi-cuadrado.
- Decisión: Si el p-valor es menor que el nivel de significancia, rechazamos la hipótesis nula.
[1] "El estadístico t obtenido es 19.66 con un p-valor de 0 . El intervalo de confianza al 95% para la media está entre 1795.77 y 1861.29 kg."
[1] "El estadístico Chi-cuadrado obtenido es 1250202.48 con un p-valor de 0 ."
- Conclusión: El análisis estadístico del peso de los vehículos ha revelado diferencias significativas respecto a los valores de referencia tanto en el promedio como en la dispersión de los datos. Esto significa que los vehículos, en promedio, pesan más de lo esperado y que existe una mayor variabilidad en sus pesos.
Prueba de hipótesis para la Media de peso
En esta sección realizamos una prueba t de Student para comparar el peso promedio de los vehículos en el conjunto de datos contra un valor de referencia (media hipotética). Esto nos permitirá determinar si existen diferencias significativas.
El parámetro de interés es la media o varianza del peso de los vehículos de las nacionalidades KOR y TAI.
H₀: Las medias o varianzas de los pesos de los vehículos de KOR y TAI son iguales.
H₁: Las medias o varianzas de los pesos de los vehículos de KOR y TAI son diferentes.
Usamos un nivel de significancia de 0.05, lo cual es común en este tipo de pruebas.
Para la media: Usamos la prueba t de Student. Para la varianza: Usamos la prueba F.
Dependiendo de los valores p de la prueba, si el p-valor es menor que el nivel de significancia, rechazamos la hipótesis nula.
Los valores necesarios se calculan automáticamente con las pruebas t y F.
Si el p-valor es menor que el nivel de significancia, rechazamos la hipótesis nula, lo que indica que existe una diferencia significativa.
[1] "El estadístico t obtenido es 1.48 con un p-valor de 0.1402 . El intervalo de confianza al 95% para la diferencia de medias está entre -37.98 y 267.88 kg."
[1] "El estadístico F obtenido es 13.63 con un p-valor de 0 . El intervalo de confianza para las varianzas está entre 9.44 y 18.74"
- Conclusión: El análisis estadístico comparativo de los pesos de vehículos entre KOR y TAI reveló dos hallazgos principales. Los pesos promedio son estadísticamente similares entre ambos países (según la prueba t de Student, p-valor = 0.1402 > 0.05). Sin embargo, existe una diferencia significativa en la variabilidad de los pesos (según la prueba F, p-valor = 0 < 0.05), lo que indica que uno de los países produce vehículos con un rango de pesos más diverso que el otro.
Prueba de hipótesis para la varianza de peso
El parámetro de interés es la varianza del peso de los vehículos de las clases CAMIONETA PASAJ y CAMIONETA REPAR.
H₀: Las varianzas de los pesos de las clases CAMIONETA PASAJ y CAMIONETA REPAR son iguales.
H₁: Las varianzas de los pesos de las clases CAMIONETA PASAJ y CAMIONETA REPAR son diferentes.
Usamos un nivel de significancia de 0.05.
Para comparar varianzas utilizamos la prueba F, que compara las varianzas de dos muestras independientes.
Si el p-valor es menor que el nivel de significancia, rechazamos la hipótesis nula.
La prueba F calcula el estadístico F utilizando las varianzas de las dos muestras.
Si el p-valor es menor que el nivel de significancia, rechazamos la hipótesis nula, lo que indica que las varianzas de los pesos son significativamente diferentes entre las dos clases.
[1] "El estadístico F obtenido es 0.47 con un p-valor de 0 . El intervalo de confianza para las varianzas está entre 0.36 y 0.61"
- conclusión: Hay evidencia estadística suficiente para afirmar que la dispersión de los pesos es significativamente diferente entre las camionetas de pasajeros y las camionetas de reparto. Específicamente, dado que el estadístico F es menor que 1 (F = 0.47), esto sugiere que las camionetas de reparto tienen una mayor variabilidad en sus pesos en comparación con las camionetas de pasajeros, las cuales muestran pesos más homogéneos.
Prueba de hipótesis para la proporción de Peso general
En esta sección determinamos si la proporción de vehículos cuyo peso supera un umbral específico es significativamente diferente de un valor hipotético.
- Parámetro de interés: la proporción de vehículos cuyo peso supera el umbral.
- Hipótesis:
- H₀: La proporción de vehículos cuyo peso supera el umbral es igual a un valor de referencia.
- H₁: La proporción de vehículos cuyo peso supera el umbral es diferente al valor de referencia.
- H₀: La proporción de vehículos cuyo peso supera el umbral es igual a un valor de referencia.
- Nivel de significancia: 0.05.
- Prueba utilizada: Prueba Z para proporciones.
- Decisión: Si el p-valor es menor que el nivel de significancia, rechazamos la hipótesis nula.
[1] "El estadístico Z obtenido es -3.52 con un p-valor de 4e-04 . La proporción observada es 0.4819 mientras que la proporción hipotética es 0.5 ."
- Conclusión: El análisis de la proporción de vehículos que superan un determinado peso ha revelado que esta proporción es significativamente diferente a la esperada del 50%. Los datos muestran que un porcentaje menor de vehículos excede este umbral de peso. Este hallazgo sugiere que la distribución de los pesos de los vehículos en la muestra no es simétrica, sino que está sesgada hacia pesos inferiores al límite establecido.
Prueba de hipótesis para la proporción del peso
Comparación de proporciones entre “CAMIONETA PASAJ.” y “CAMIONETA REPAR.”
Parámetro de interés: Proporción de vehículos en cada categoría.
Hipótesis nula (H0): Las proporciones de “CAMIONETA PASAJ.” y “CAMIONETA REPAR.” son iguales (p1=p2).
Hipótesis alternativa (H1): Las proporciones de “CAMIONETA PASAJ.” y “CAMIONETA REPAR.” son diferentes (p1=p2).
Nivel de significancia (α): 0.05.
Estadístico de prueba: Prueba de proporciones (Z).
Región de rechazo: Rechazar H0 si ∣Z∣>Z α/2(valor crítico para (α=0.05).
CAMIONETA PASAJ. CAMIONETA REPAR
998 120
[1] "El estadístico Chi-cuadrado obtenido es 1375.9 con un p-valor de 0 . El intervalo de confianza para la diferencia de proporciones está entre 0.7588 y 0.8119"
- Conclusión: Rechazamos la hipótesis nula (H0), Existe evidencia estadísticamente significativa para concluir que las proporciones de vehículos clasificados como “CAMIONETA PASAJ.” y “CAMIONETA REPAR.” son diferentes. Específicamente, la proporción de “CAMIONETA PASAJ.” es significativamente mayor que la de “CAMIONETA REPAR.”, con una diferencia estimada en el intervalo de 0.7588 a 0.8119.
Comparación de la proporción del peso entre vehículos de nacionalidad “KOR” y “TAI”
Detalles del análisis:
- Parámetro de interés: La proporción de vehículos cuyo peso es mayor o menor a un valor de referencia entre las nacionalidades KOR y TAI.
- Hipótesis nula (H₀): Las proporciones de vehículos con peso superior al valor de referencia son iguales entre las nacionalidades KOR y TAI. (p₁ = p₂)
- Hipótesis alternativa (H₁): Las proporciones de vehículos con peso superior al valor de referencia son diferentes entre las nacionalidades KOR y TAI. (p₁ ≠ p₂)
- Nivel de significancia (α): 0.05.
- Estadístico de prueba: Prueba de proporciones Z.
A continuación, el análisis en R:
[1] "El estadístico Z obtenido es 44.25 con un p-valor de 0 . El intervalo de confianza para la diferencia de proporciones está entre -0.4965 y -0.3301"
- Conclusión: Este resultado sugiere que las nacionalidades KOR y TAI tienen una distribución distinta en cuanto al peso de sus vehículos, lo cual podría deberse a diferencias en las características de diseño, estándares nacionales, o preferencias específicas en cada mercado.
Comparación de la diferencia de medias de potencia entre las nacionalidades KOR y TAI
Detalles del análisis:
- Parámetro de interés: La diferencia de medias de Potencia entre las nacionalidades KOR y TAI.
- Hipótesis nula (H₀): La media de Potencia es igual entre las nacionalidades KOR y TAI. (μ₁ = μ₂)
- Hipótesis alternativa (H₁): La media de Potencia es diferente entre las nacionalidades KOR y TAI. (μ₁ ≠ μ₂)
- Nivel de significancia (α): 0.05.
- Estadístico de prueba: Prueba t de dos muestras independientes.
A continuación, el análisis en R:
[1] "El estadístico t obtenido es -2.8 con un p-valor de 0.0052 . El intervalo de confianza para la diferencia de medias está entre -35.12 y -6.17"
- Conclusión: Existe suficiente evidencia estadística para concluir que la media de potencia de los vehículos de nacionalidad KOR es significativamente menor que la de los vehículos de nacionalidad TAI.
Comparación de la razón de varianza de potencia entre las clases CAMIONETA PASAJ y CAMIONETA REPAR
Detalles del análisis:
- Parámetro de interés: La razón de varianza de Potencia entre las clases CAMIONETA PASAJ y CAMIONETA REPAR.
- Hipótesis nula (H₀): Las varianzas de Potencia son iguales entre las clases CAMIONETA PASAJ y CAMIONETA REPAR. (σ₁² = σ₂²)
- Hipótesis alternativa (H₁): Las varianzas de Potencia son diferentes entre las clases CAMIONETA PASAJ y CAMIONETA REPAR. (σ₁² ≠ σ₂²)
- Nivel de significancia (α): 0.05.
- Estadístico de prueba: Prueba F para la razón de varianzas.
A continuación, el análisis en R:
[1] "El estadístico F obtenido es 4.8 con un p-valor de 0 . El intervalo de confianza para la razón de varianza está entre 3.61 y 6.2"
- Conclusión: Este resultado sugiere que los vehículos clasificados como “CAMIONETA PASAJ.” tienen una mayor dispersión o variabilidad en las potencias registradas en comparación con los de “CAMIONETA REPAR.”.
Comparación de proporciones de vehículos con alta potencia entre las nacionalidades KOR y TAI
Detalles del análisis:
- Parámetro de interés: Proporción de vehículos con Potencia por encima de un umbral (por ejemplo, 150) entre las nacionalidades KOR y TAI.
- Hipótesis nula (H₀): Las proporciones de vehículos con Potencia mayor a 150 son iguales entre las nacionalidades KOR y TAI. (p₁ = p₂)
- Hipótesis alternativa (H₁): Las proporciones de vehículos con Potencia mayor a 150 son diferentes entre las nacionalidades KOR y TAI. (p₁ ≠ p₂)
- Nivel de significancia (α): 0.05.
- Estadístico de prueba: Prueba de proporciones.
A continuación, el análisis en R:
[1] "El estadístico Chi-cuadrado obtenido es 41.96 con un p-valor de 0 . El intervalo de confianza para la diferencia de proporciones está entre 0.0822 y 0.1857"
- Conclusión: El intervalo de confianza indica que la diferencia en proporciones está estimada entre 0.0822 y 0.1857, con un nivel de confianza del 95%.Esto significa que, en promedio, la proporción de vehículos con alta potencia es mayor en una de las dos nacionalidades, lo cual puede ser relevante para el análisis de características técnicas o preferencias del mercado.
Comparación de proporciones de vehículos con alta potencia entre las clases CAMIONETA PASAJ y CAMIONETA REPAR
Detalles del análisis:
- Parámetro de interés: Proporción de vehículos con Potencia por encima de un umbral (por ejemplo, 150) entre las clases CAMIONETA PASAJ y CAMIONETA REPAR.
- Hipótesis nula (H₀): Las proporciones de vehículos con Potencia mayor a 150 son iguales entre las clases CAMIONETA PASAJ y CAMIONETA REPAR. (p₁ = p₂)
- Hipótesis alternativa (H₁): Las proporciones de vehículos con Potencia mayor a 150 son diferentes entre las clases CAMIONETA PASAJ y CAMIONETA REPAR. (p₁ ≠ p₂)
- Nivel de significancia (α): 0.05.
- Estadístico de prueba: Prueba de proporciones.
A continuación, el análisis en R:
[1] "El estadístico Chi-cuadrado obtenido es 80.84 con un p-valor de 0 . El intervalo de confianza para la diferencia de proporciones está entre -0.2036 y -0.1337"
- Conclusión: En CAMIONETA REPAR, la proporción de vehículos con potencia superior a 150 es más alta, lo cual puede ser indicativo de necesidades técnicas específicas o un enfoque en vehículos de mayor rendimiento dentro de esta clase.
Conclusión General
Los resultados obtenidos del análisis estadístico permiten extraer conclusiones importantes sobre las características de los vehículos en Colombia, con base en las hipótesis planteadas. Estas conclusiones abarcan aspectos relacionados con el peso y la potencia de los vehículos según su nacionalidad (KOR y TAI) y clase (CAMIONETA PASAJ y CAMIONETA REPAR). A continuación, se presentan las observaciones más relevantes y sus implicaciones:
Los carros de Corea del Sur y Tailandia pesan, en promedio, lo mismo. Sin embargo, los carros tailandeses tienen una variedad de pesos mucho mayor que los coreanos. Esto indica que los fabricantes de cada país tienen diferentes estrategias de diseño y producción.
Las camionetas de pasajeros tienen una potencia promedio más alta y una mayor variabilidad en comparación con las camionetas de reparto. Esto podría reflejar necesidades diferentes de rendimiento, donde las camionetas de pasajeros requieren motores más potentes.
Tanto entre nacionalidades como entre clases, se encontraron diferencias en la proporción de vehículos con alta potencia. Las camionetas de pasajeros y una de las nacionalidades analizadas tienen una mayor proporción de vehículos potentes, lo que puede estar relacionado con necesidades de mercado o enfoques en alto rendimiento.
Las diferencias observadas destacan la influencia de la nacionalidad y la clase del vehículo en sus características técnicas. Estos hallazgos pueden ser útiles para ajustar estrategias de producción y comercialización, asegurando que los vehículos se alineen con las expectativas del mercado