Estudio Productividad y Calidad Automovilistica en Mexico.
El Estudio se realizo con la informacion proporcionada por el INEGI (https://www.inegi.org.mx/datosprimarios/iavl/#Datos_abiertos)
Conjunto de datos de vehiculos
setwd("~/Documents/pye1pm")Paquetes
library(pacman)
p_load("datasets","DT","fdth","prettydoc","xfun","ggplot2","beanplot", "readr")Venta_mensual_2018 <- read_csv("Venta_mensual_2018.csv")##
## ── Column specification ────────────────────────────────────────────────────────
## cols(
## MARCA = col_character(),
## `Suma - UNI_VEH` = col_double()
## )
dim(Venta_mensual_2018)## [1] 35 2
datatable(Venta_mensual_2018)Analizando Datos de 2018
En la tabla se muestra que la marca con mayor venta es nissan siguiendole detras general motors en 2018 el mercado de autos nuevos en México cerró con un total de 1,427,086 unidades vendidas.
Medidas de tendencia central y distribución del conjunto de datos
summary(Venta_mensual_2018)## MARCA Suma - UNI_VEH
## Length:35 Min. : 9
## Class :character 1st Qu.: 1924
## Mode :character Median : 14061
## Mean : 81548
## 3rd Qu.: 60960
## Max. :1427086
Grafico de caja y bigote
boxplot(Venta_mensual_2018$`Suma - UNI_VEH`)
abline(h = mean(Venta_mensual_2018$MARCA), col= "red")## Warning in mean.default(Venta_mensual_2018$MARCA): argument is not numeric or
## logical: returning NA
var(Venta_mensual_2018$`Suma - UNI_VEH`)## [1] 59634514667
sd(Venta_mensual_2018$`Suma - UNI_VEH`)## [1] 244201.8
plot(Venta_mensual_2018$`Suma - UNI_VEH`)hist(Venta_mensual_2018$`Suma - UNI_VEH`)library(readr)
raiavl_venta_mensual_tr_cifra_2021 <- read_csv("raiavl_venta_mensual_tr_cifra_2021.csv")##
## ── Column specification ────────────────────────────────────────────────────────
## cols(
## MARCA = col_character(),
## `Suma - UNI_VEH` = col_double()
## )
aqui comienza el estudio en relazion con el año 2021
datatable(raiavl_venta_mensual_tr_cifra_2021)analizando los datos
Las ventas de autos nuevos en México lograron crecer respecto a años anteriores, con un total de 1,014,735 unidades vendidas, de acuerdo con cifras del INEGI.
dim(raiavl_venta_mensual_tr_cifra_2021)## [1] 37 2
summary(raiavl_venta_mensual_tr_cifra_2021)## MARCA Suma - UNI_VEH
## Length:37 Min. : 0
## Class :character 1st Qu.: 1045
## Mode :character Median : 11353
## Mean : 54850
## 3rd Qu.: 40763
## Max. :1014735
Inferencia por contraste de hipótesis
¿Qué año tuvo más ventas?
- 2018 (pre pandemia)
- 2021 (post pandemia)
Aquí lo que buscamos es conocer de que forma la pandemia afecto a la venta de automóviles
ventas <- read_csv("ventas.csv")##
## ── Column specification ────────────────────────────────────────────────────────
## cols(
## MARCA = col_character(),
## Ventas = col_double(),
## Year = col_double()
## )
Gráfico comparativo
boxplot(ventas$Ventas ~ ventas$Year, col= "green")Al parecer nuestra hipótesis de que antes de la pandemía se vendían Más carros parece ser cierta dado la figura anterior
Para poder estar seguros de esto necesitamos formular nuestras hipótesis pero antes de eso hay que estar seguros de que los datos SON normales, dado que únicamente de esta forma lo que generalicemos sobre ellos será REPRESENTATIVO
- Prueba de normalidad para datos de 2018
shapiro.test(ventas$Ventas)##
## Shapiro-Wilk normality test
##
## data: ventas$Ventas
## W = 0.63435, p-value = 6.379e-12
- Ahora seguir los pasos de este ejercicio: https://rpubs.com/jigbadouin/inferenciasPYE
PAra llegar a una conclusión de prueba de hipótesis por contraste
*h0: NO existen diferencias significativas entre los años
*h1: SI existen diferencias significativas entre los años como para poder decir que en determinado año se vendía más
Descargar
- Código
xfun::embed_file("CasoEstudio.Rmd")- Datos de ventas de 2021
xfun::embed_file("raiavl_venta_mensual_tr_cifra_2021.csv")Download raiavl_venta_mensual_tr_cifra_2021.csv
*Datos de ventas de 2018
xfun::embed_file("Venta_mensual_2018.csv")Download Venta_mensual_2018.csv
- Datos de ventas en conjunto
xfun::embed_file("ventas.csv")