Prueba de Hipótesis sobre las Características de Vehículos en Colombia: Peso, Potencia, Nacionalidad y Clase

Author

Isabel y Jacobo


Datos

Los datos analizados provienen de una base de vehículos en Colombia que incluye las siguientes variables:

Variable Tipo Subtipo Escala
Nacionalidad Cualitativa Nominal Nominal
Clase Cualitativa Nominal Nominal
Peso Cuantitativa Continua Razón
Potencia Cuantitativa Continua Razón

Hipótesis planteadas

  • Hipótesis 1:El gerente general de la compañía desea analizar si existen diferencias significativas en las características de peso de los vehículos según su nacionalidad (KOR y TAI) y su clase (CAMIONETA PASAJ y CAMIONETA REPAR). Este análisis busca evaluar tanto la media como la variabilidad en el peso de los vehículos, con el fin de entender si la procedencia y el tipo de vehículo influyen en estas características.

  • Hipótesis 2: El gerente general desea analizar si existen diferencias significativas en la proporción de vehículos con peso superior a un valor de referencia (en este caso, 1500 kg), según las categorías “CAMIONETA PASAJ.” y “CAMIONETA REPAR.” así como las nacionalidades “KOR” y “TAI”. El objetivo de este análisis es determinar si la clase del vehículo (CAMIONETA PASAJ. y CAMIONETA REPAR.) y la nacionalidad (KOR y TAI) influyen en la proporción de vehículos que superan un peso crítico.

  • Hipótesis 3: El departamento de investigación desea analizar si existen diferencias significativas en la potencia de los vehículos, tanto en la media como en la variabilidad, según la nacionalidad (KOR o TAI) y la clase del vehículo (CAMIONETA PASAJ. y CAMIONETA REPAR.). Se utilizarán pruebas de hipótesis para comparar las medias de potencia entre nacionalidades y las varianzas de potencia entre clases, con el objetivo de determinar si estas variables influyen significativamente en la potencia de los vehículos.

  • Hipótesis 4: El departamento de investigación de la empresa busca analizar si existen diferencias significativas en la proporción de vehículos con Potencia superior a 150 entre distintos grupos. Se compararán las proporciones de vehículos con alta potencia según la Nacionalidad (KOR y TAI) y la Clase del vehículo (CAMIONETA PASAJ. y CAMIONETA REPAR.). El objetivo es determinar si estas variables influyen en la proporción de vehículos con alta potencia.

Estadísticas Descriptivas de Variables Cuantitativas

Peso

Estadísticas descriptivas del peso de los vehículos según la nacionalidad
Nacionalidad Promedio Mediana Desviación_Estándar Varianza Mínimo Máximo
ALE 1684.98 1545.0 1020.56 1041536.26 100 10988
ARG 1967.11 1337.0 1316.15 1732240.94 1025 5800
AUS 173.35 186.0 37.73 1423.62 52 229
BRA 2731.91 1375.0 2226.71 4958249.73 98 10700
CAN 1818.95 1948.0 346.36 119963.85 1197 2500
CHI 1809.97 1510.0 1723.20 2969432.97 60 14400
CHL 1353.46 1280.0 264.35 69881.22 980 1850
COL 1802.12 1273.0 1547.36 2394319.25 58 9650
CZE 1146.87 1117.5 174.37 30405.72 148 1551
ECU 1519.89 1550.0 303.37 92031.55 800 2400
ENG 1535.15 1645.0 818.13 669338.89 100 3240
ESP 1212.19 1121.0 746.85 557787.45 118 7800
FRA 1721.03 1314.0 1483.30 2200179.86 780 10732
HNG 1326.48 1280.0 185.32 34343.40 1075 1730
IDN 1313.00 1905.0 1047.10 1096417.00 104 1930
IND 850.39 765.0 873.05 762216.84 95 3925
ITA 647.93 189.0 1158.22 1341463.76 68 9530
JAP 1644.92 1489.0 1260.66 1589273.72 55 9795
KOR 1853.82 1471.0 1645.30 2707013.13 56 14470
MEX 2489.24 1395.0 2200.72 4843158.92 155 15422
NED 9317.00 9317.0 0.00 0.00 9317 9317
RUM 1415.71 1250.0 327.25 107095.24 1180 2000
RUS 9955.45 8225.0 11006.62 121145722.27 1250 41000
SUE 1938.45 1577.0 1500.78 2252351.33 1054 9740
TAI 1738.86 1830.0 445.59 198548.20 146 2750
TWN 128.83 109.5 41.91 1756.67 80 234
USA 2262.39 1841.0 1684.81 2838576.02 136 15000
VEN 2016.45 1764.0 1317.65 1736209.04 700 7767

Potencia

Estadísticas descriptivas de la potencia de los vehículos según la clase
Clase Promedio Mediana Desviación_Estándar Varianza Mínimo Máximo
AUTOMOVIL 150.39 122 86.48 7478.95 36 662
BUS / BUSETA / MICROBUS 150.60 140 58.16 3382.05 50 420
CAMION 149.99 135 61.45 3776.30 47 394
CAMIONETA PASAJ. 165.66 153 75.18 5651.34 39 585
CAMIONETA REPAR 94.80 87 34.32 1177.66 39 205
CAMPERO 202.41 180 81.78 6688.07 45 567
CARROTANQUE 182.90 173 56.75 3220.99 92 340
CHASIS 171.96 141 78.53 6166.40 47 440
FURGON 139.29 126 52.97 2805.76 47 400
MOTOCARRO 17.94 14 13.65 186.33 7 54
MOTOCICLETA 42.97 15 48.45 2347.43 3 207
PICKUP DOBLE CAB 166.69 141 83.82 7025.48 47 420
PICKUP SENCILLA 144.67 120 74.86 5604.47 41 385
REMOLCADOR 359.19 400 87.01 7570.94 190 480
VOLQUETA 251.76 240 89.48 8006.79 95 440

Análisis de Normalidad

Peso

Histograma de Peso por Nacionalidad
  • Conclusión: Las gráficas sugieren que hay diferencias en la distribución del peso entre los países KOR y TAI, siendo el país KOR el que presenta un peso promedio ligeramente mayor y una mayor variabilidad. Además, los datos de ambos países no siguen una distribución normal.

Potencia

Histograma de Potencia por Clase
  • Conclusión: Las gráficas sugieren que hay diferencias en la distribución de la potencia entre las camionetas de pasajeros y de reparto, siendo las camionetas de pasajeros las que presentan una potencia promedio ligeramente mayor y una mayor variabilidad. Además, los datos de ambas clases no siguen una distribución normal.

Boxplot Comparativos

Peso vs Nacionalidad


KOR TAI 
815  73 

Histograma de Potencia por Nacionalidad
  • Conclusión: Los datos sugieren que existen diferencias en la distribución de la potencia entre los vehículos coreanos y tailandeses, siendo los coreanos los que presentan una potencia promedio mayor y una mayor variabilidad.

Potencia vs Clase

Boxplot de Potencia por Clase
  • conclusión: El boxplot muestra claramente que existe una diferencia significativa en la potencia promedio entre las camionetas de pasajeros y de reparto. Las primeras tienden a tener motores más potentes, aunque también presentan una mayor variabilidad en la potencia.

Prueba de hipótesis para la Media y Varianza del Peso general

En esta sección realizamos pruebas para determinar si existen diferencias significativas en la media y la varianza del peso de los vehículos en el conjunto de datos.

  • Parámetro de interés: la media y la varianza del peso de los vehículos.
  • Hipótesis:
    • Para la media:
      • H₀: La media del peso es igual a un valor de referencia.
      • H₁: La media del peso es diferente al valor de referencia.
    • Para la varianza:
      • H₀: La varianza del peso es igual a un valor de referencia.
      • H₁: La varianza del peso es diferente al valor de referencia.
  • Nivel de significancia: 0.05.
  • Pruebas utilizadas:
    • Para la media: Prueba t de Student.
    • Para la varianza: Prueba Chi-cuadrado.
  • Decisión: Si el p-valor es menor que el nivel de significancia, rechazamos la hipótesis nula.
[1] "El estadístico t obtenido es 19.66 con un p-valor de 0 . El intervalo de confianza al 95% para la media está entre 1795.77 y 1861.29 kg."
[1] "El estadístico Chi-cuadrado obtenido es 1250202.48 con un p-valor de 0 ."
  • Conclusión: El análisis estadístico del peso de los vehículos ha revelado diferencias significativas respecto a los valores de referencia tanto en el promedio como en la dispersión de los datos. Esto significa que los vehículos, en promedio, pesan más de lo esperado y que existe una mayor variabilidad en sus pesos.

Prueba de hipótesis para la Media de peso

En esta sección realizamos una prueba t de Student para comparar el peso promedio de los vehículos en el conjunto de datos contra un valor de referencia (media hipotética). Esto nos permitirá determinar si existen diferencias significativas.

  • El parámetro de interés es la media o varianza del peso de los vehículos de las nacionalidades KOR y TAI.

  • H₀: Las medias o varianzas de los pesos de los vehículos de KOR y TAI son iguales.

  • H₁: Las medias o varianzas de los pesos de los vehículos de KOR y TAI son diferentes.

  • Usamos un nivel de significancia de 0.05, lo cual es común en este tipo de pruebas.

  • Para la media: Usamos la prueba t de Student. Para la varianza: Usamos la prueba F.

  • Dependiendo de los valores p de la prueba, si el p-valor es menor que el nivel de significancia, rechazamos la hipótesis nula.

  • Los valores necesarios se calculan automáticamente con las pruebas t y F.

  • Si el p-valor es menor que el nivel de significancia, rechazamos la hipótesis nula, lo que indica que existe una diferencia significativa.

[1] "El estadístico t obtenido es 1.48 con un p-valor de 0.1402 . El intervalo de confianza al 95% para la diferencia de medias está entre -37.98 y 267.88 kg."
[1] "El estadístico F obtenido es 13.63 con un p-valor de 0 . El intervalo de confianza para las varianzas está entre 9.44 y 18.74"
  • Conclusión: El análisis estadístico comparativo de los pesos de vehículos entre KOR y TAI reveló dos hallazgos principales. Los pesos promedio son estadísticamente similares entre ambos países (según la prueba t de Student, p-valor = 0.1402 > 0.05). Sin embargo, existe una diferencia significativa en la variabilidad de los pesos (según la prueba F, p-valor = 0 < 0.05), lo que indica que uno de los países produce vehículos con un rango de pesos más diverso que el otro.

Prueba de hipótesis para la varianza de peso

  • El parámetro de interés es la varianza del peso de los vehículos de las clases CAMIONETA PASAJ y CAMIONETA REPAR.

  • H₀: Las varianzas de los pesos de las clases CAMIONETA PASAJ y CAMIONETA REPAR son iguales.

  • H₁: Las varianzas de los pesos de las clases CAMIONETA PASAJ y CAMIONETA REPAR son diferentes.

  • Usamos un nivel de significancia de 0.05.

  • Para comparar varianzas utilizamos la prueba F, que compara las varianzas de dos muestras independientes.

  • Si el p-valor es menor que el nivel de significancia, rechazamos la hipótesis nula.

  • La prueba F calcula el estadístico F utilizando las varianzas de las dos muestras.

  • Si el p-valor es menor que el nivel de significancia, rechazamos la hipótesis nula, lo que indica que las varianzas de los pesos son significativamente diferentes entre las dos clases.

[1] "El estadístico F obtenido es 0.47 con un p-valor de 0 . El intervalo de confianza para las varianzas está entre 0.36 y 0.61"
  • conclusión: Hay evidencia estadística suficiente para afirmar que la dispersión de los pesos es significativamente diferente entre las camionetas de pasajeros y las camionetas de reparto. Específicamente, dado que el estadístico F es menor que 1 (F = 0.47), esto sugiere que las camionetas de reparto tienen una mayor variabilidad en sus pesos en comparación con las camionetas de pasajeros, las cuales muestran pesos más homogéneos.

Prueba de hipótesis para la proporción de Peso general

En esta sección determinamos si la proporción de vehículos cuyo peso supera un umbral específico es significativamente diferente de un valor hipotético.

  • Parámetro de interés: la proporción de vehículos cuyo peso supera el umbral.
  • Hipótesis:
    • H₀: La proporción de vehículos cuyo peso supera el umbral es igual a un valor de referencia.
    • H₁: La proporción de vehículos cuyo peso supera el umbral es diferente al valor de referencia.
  • Nivel de significancia: 0.05.
  • Prueba utilizada: Prueba Z para proporciones.
  • Decisión: Si el p-valor es menor que el nivel de significancia, rechazamos la hipótesis nula.
[1] "El estadístico Z obtenido es -3.52 con un p-valor de 4e-04 . La proporción observada es 0.4819 mientras que la proporción hipotética es 0.5 ."
  • Conclusión: El análisis de la proporción de vehículos que superan un determinado peso ha revelado que esta proporción es significativamente diferente a la esperada del 50%. Los datos muestran que un porcentaje menor de vehículos excede este umbral de peso. Este hallazgo sugiere que la distribución de los pesos de los vehículos en la muestra no es simétrica, sino que está sesgada hacia pesos inferiores al límite establecido.

Prueba de hipótesis para la proporción del peso

Comparación de proporciones entre “CAMIONETA PASAJ.” y “CAMIONETA REPAR.”

  • Parámetro de interés: Proporción de vehículos en cada categoría.

  • Hipótesis nula (H0): Las proporciones de “CAMIONETA PASAJ.” y “CAMIONETA REPAR.” son iguales (p1=p2).

  • Hipótesis alternativa (H1): Las proporciones de “CAMIONETA PASAJ.” y “CAMIONETA REPAR.” son diferentes (p1=p2).

  • Nivel de significancia (α): 0.05.

  • Estadístico de prueba: Prueba de proporciones (Z).

  • Región de rechazo: Rechazar H0 si ∣Z∣>Z α/2(valor crítico para (α=0.05).


CAMIONETA PASAJ.  CAMIONETA REPAR 
             998              120 
[1] "El estadístico Chi-cuadrado obtenido es 1375.9 con un p-valor de 0 . El intervalo de confianza para la diferencia de proporciones está entre 0.7588 y 0.8119"
  • Conclusión: Rechazamos la hipótesis nula (H0), Existe evidencia estadísticamente significativa para concluir que las proporciones de vehículos clasificados como “CAMIONETA PASAJ.” y “CAMIONETA REPAR.” son diferentes. Específicamente, la proporción de “CAMIONETA PASAJ.” es significativamente mayor que la de “CAMIONETA REPAR.”, con una diferencia estimada en el intervalo de 0.7588 a 0.8119.

Comparación de la proporción del peso entre vehículos de nacionalidad “KOR” y “TAI”

Detalles del análisis:

  • Parámetro de interés: La proporción de vehículos cuyo peso es mayor o menor a un valor de referencia entre las nacionalidades KOR y TAI.
  • Hipótesis nula (H₀): Las proporciones de vehículos con peso superior al valor de referencia son iguales entre las nacionalidades KOR y TAI. (p₁ = p₂)
  • Hipótesis alternativa (H₁): Las proporciones de vehículos con peso superior al valor de referencia son diferentes entre las nacionalidades KOR y TAI. (p₁ ≠ p₂)
  • Nivel de significancia (α): 0.05.
  • Estadístico de prueba: Prueba de proporciones Z.

A continuación, el análisis en R:

[1] "El estadístico Z obtenido es 44.25 con un p-valor de 0 . El intervalo de confianza para la diferencia de proporciones está entre -0.4965 y -0.3301"
  • Conclusión: Este resultado sugiere que las nacionalidades KOR y TAI tienen una distribución distinta en cuanto al peso de sus vehículos, lo cual podría deberse a diferencias en las características de diseño, estándares nacionales, o preferencias específicas en cada mercado.

Comparación de la diferencia de medias de potencia entre las nacionalidades KOR y TAI

Detalles del análisis:

  • Parámetro de interés: La diferencia de medias de Potencia entre las nacionalidades KOR y TAI.
  • Hipótesis nula (H₀): La media de Potencia es igual entre las nacionalidades KOR y TAI. (μ₁ = μ₂)
  • Hipótesis alternativa (H₁): La media de Potencia es diferente entre las nacionalidades KOR y TAI. (μ₁ ≠ μ₂)
  • Nivel de significancia (α): 0.05.
  • Estadístico de prueba: Prueba t de dos muestras independientes.

A continuación, el análisis en R:

[1] "El estadístico t obtenido es -2.8 con un p-valor de 0.0052 . El intervalo de confianza para la diferencia de medias está entre -35.12 y -6.17"
  • Conclusión: Existe suficiente evidencia estadística para concluir que la media de potencia de los vehículos de nacionalidad KOR es significativamente menor que la de los vehículos de nacionalidad TAI.

Comparación de la razón de varianza de potencia entre las clases CAMIONETA PASAJ y CAMIONETA REPAR

Detalles del análisis:

  • Parámetro de interés: La razón de varianza de Potencia entre las clases CAMIONETA PASAJ y CAMIONETA REPAR.
  • Hipótesis nula (H₀): Las varianzas de Potencia son iguales entre las clases CAMIONETA PASAJ y CAMIONETA REPAR. (σ₁² = σ₂²)
  • Hipótesis alternativa (H₁): Las varianzas de Potencia son diferentes entre las clases CAMIONETA PASAJ y CAMIONETA REPAR. (σ₁² ≠ σ₂²)
  • Nivel de significancia (α): 0.05.
  • Estadístico de prueba: Prueba F para la razón de varianzas.

A continuación, el análisis en R:

[1] "El estadístico F obtenido es 4.8 con un p-valor de 0 . El intervalo de confianza para la razón de varianza está entre 3.61 y 6.2"
  • Conclusión: Este resultado sugiere que los vehículos clasificados como “CAMIONETA PASAJ.” tienen una mayor dispersión o variabilidad en las potencias registradas en comparación con los de “CAMIONETA REPAR.”.

Comparación de proporciones de vehículos con alta potencia entre las nacionalidades KOR y TAI

Detalles del análisis:

  • Parámetro de interés: Proporción de vehículos con Potencia por encima de un umbral (por ejemplo, 150) entre las nacionalidades KOR y TAI.
  • Hipótesis nula (H₀): Las proporciones de vehículos con Potencia mayor a 150 son iguales entre las nacionalidades KOR y TAI. (p₁ = p₂)
  • Hipótesis alternativa (H₁): Las proporciones de vehículos con Potencia mayor a 150 son diferentes entre las nacionalidades KOR y TAI. (p₁ ≠ p₂)
  • Nivel de significancia (α): 0.05.
  • Estadístico de prueba: Prueba de proporciones.

A continuación, el análisis en R:

[1] "El estadístico Chi-cuadrado obtenido es 41.96 con un p-valor de 0 . El intervalo de confianza para la diferencia de proporciones está entre 0.0822 y 0.1857"
  • Conclusión: El intervalo de confianza indica que la diferencia en proporciones está estimada entre 0.0822 y 0.1857, con un nivel de confianza del 95%.Esto significa que, en promedio, la proporción de vehículos con alta potencia es mayor en una de las dos nacionalidades, lo cual puede ser relevante para el análisis de características técnicas o preferencias del mercado.

Comparación de proporciones de vehículos con alta potencia entre las clases CAMIONETA PASAJ y CAMIONETA REPAR

Detalles del análisis:

  • Parámetro de interés: Proporción de vehículos con Potencia por encima de un umbral (por ejemplo, 150) entre las clases CAMIONETA PASAJ y CAMIONETA REPAR.
  • Hipótesis nula (H₀): Las proporciones de vehículos con Potencia mayor a 150 son iguales entre las clases CAMIONETA PASAJ y CAMIONETA REPAR. (p₁ = p₂)
  • Hipótesis alternativa (H₁): Las proporciones de vehículos con Potencia mayor a 150 son diferentes entre las clases CAMIONETA PASAJ y CAMIONETA REPAR. (p₁ ≠ p₂)
  • Nivel de significancia (α): 0.05.
  • Estadístico de prueba: Prueba de proporciones.

A continuación, el análisis en R:

[1] "El estadístico Chi-cuadrado obtenido es 80.84 con un p-valor de 0 . El intervalo de confianza para la diferencia de proporciones está entre -0.2036 y -0.1337"
  • Conclusión: En CAMIONETA REPAR, la proporción de vehículos con potencia superior a 150 es más alta, lo cual puede ser indicativo de necesidades técnicas específicas o un enfoque en vehículos de mayor rendimiento dentro de esta clase.

Conclusión General

Los resultados obtenidos del análisis estadístico permiten extraer conclusiones importantes sobre las características de los vehículos en Colombia, con base en las hipótesis planteadas. Estas conclusiones abarcan aspectos relacionados con el peso y la potencia de los vehículos según su nacionalidad (KOR y TAI) y clase (CAMIONETA PASAJ y CAMIONETA REPAR). A continuación, se presentan las observaciones más relevantes y sus implicaciones:

  1. Los carros de Corea del Sur y Tailandia pesan, en promedio, lo mismo. Sin embargo, los carros tailandeses tienen una variedad de pesos mucho mayor que los coreanos. Esto indica que los fabricantes de cada país tienen diferentes estrategias de diseño y producción.

  2. Las camionetas de pasajeros tienen una potencia promedio más alta y una mayor variabilidad en comparación con las camionetas de reparto. Esto podría reflejar necesidades diferentes de rendimiento, donde las camionetas de pasajeros requieren motores más potentes.

  3. Tanto entre nacionalidades como entre clases, se encontraron diferencias en la proporción de vehículos con alta potencia. Las camionetas de pasajeros y una de las nacionalidades analizadas tienen una mayor proporción de vehículos potentes, lo que puede estar relacionado con necesidades de mercado o enfoques en alto rendimiento.

  4. Las diferencias observadas destacan la influencia de la nacionalidad y la clase del vehículo en sus características técnicas. Estos hallazgos pueden ser útiles para ajustar estrategias de producción y comercialización, asegurando que los vehículos se alineen con las expectativas del mercado