¿Qué es un análisis exploratorio de los datos?
El Análisis Exploratorio de los Datos (EDA por sus siglas en inglés) es un proceso crítico a la hora de manipular datasets, en el cual se suelen implementar distintas técnicas de visualización con el fin de tener un primer acercamiento con el conjunto de datos y sus variables, identificando patrones o el comportamiento en general de estas, para lograr esto podemos hacer uso de las medidas descriptivas y de dispersión así como la implementación de gráficos que faciliten la comprensión visual de patrones, anomalías y comenzar a generar suposiciones correctas sobre los datos.
¿Cómo contribuye el análisis exploratorio de los datos a mejorar el proceso y los resultados de analítica descriptiva?
El EDA es parte fundamental de cualquier análisis de datos, pues mediante este mismo es que se tiene un primer acercamiento con los datos logrando conocer sus principales características como estructura de los datos, tipos de variables y las relaciones que existen entre ellas, entre otas muchas que podemos descubrir gracias a la implementación de diversos métodos de visualización, una vez concluido el EDA se espera tener una mejor noción de la naturaleza de los datos y como manipular los datasets de la mejor manera posible, de esta manera logramos una comprensión sólida y completa de los datos con los que se estarán trabajando durante las siguientes etapas del proyecto.
Visión: En 2033 seremos una de las cinco mejores compañías de México que generan valor dentro de la cadena de suministro de las industrias que más valoran la forma en la que se protegen y trasladan las cosas.
Misión: Transformar nuestro entorno y resolver retos industriales de nuestros clientes a través de la colaboración, provocando nuevas oportunidades que potencian nuestro modelo de negocio, para alcanzar nuestros ideales.
Ojetivos estratégicos:
* Impulso Sostenible e Innovador: Desarrollar e implementar
soluciones de empaque automotriz que fusionen la sustentabilidad y la
innovación, priorizando la adopción de materiales ecoamigables y la
constante búsqueda de nuevas tecnologías para reducir el impacto
ambiental y mejorar la eficiencia en toda la cadena de suministro.
Efectividad y Calidad Colaborativas: Implementar prácticas que potencien la efectividad operativa y la excelencia en la calidad del empaque automotriz, asegurando que cada proceso contribuya a la eficiencia total y a la satisfacción del cliente.
Desarrollo Integral del Personal: Fomentar un entorno laboral que promueva la integridad, la transparencia y el desarrollo continuo de los colaboradores, contribuyendo a la retención de talento y al fortalecimiento de la cultura organizacional.
Las fuentes de datos utilizadas para realizar los gráficos fueron: mex_exports_autoparts, Importers of Cartons boxes of corrugated paper or board 2020-2021, Exporters of Cartons boxes of corrugated paper or board 2020-2021, mx_automotive_industry, y US_Auto_Production_Sales.
Los Top 5 países con mayores exportaciones de cartón durante el 2020 y el 2021 con sus respectivas cantidades fueron: China (1,593,052,767), Alemania (1,413,035,728), Estados Unidos (1,319,071,812), Países Bajos (651,558,509), Polonia (609,084,661).
Los Top 5 países con mayores importaciones de cartón durante el 2020 y el 2021 con sus respectivas cantidades fueron: Alemania (989,233,288), Estados Unidos (956,481,957), Países Bajos (850,169,637), México (778,911,138), Francia (682135350)
En esta sección se observó que para las exportaciones, Europa realizó más exportaciones, pero la cantidad de contenido exportado fue mayor por parte del continente Asiático. En cuanto a las importaciones, Europa fue el país con mayores exportaciones y contenido exportado.
Los Estados de México que exportaron más autopartes en 2021 fueron Coahuila, Querétaro, Guanajuato, Ciudad de México y Nuevo León. En 2022, Coahuila se mantuvo como el Estado que más exportaciones de autopartes realizó, seguido por Puebla, Querétaro, Guanajuato y Ciudad de México.
Las 5 principales autopartes que exportó Estados Unidos en 2021 fueron: todas las demás piezas de automóviles, piezas de carrocería excepto cabinas, cajas de cambios, ejes motrices con diferencial y frenos y piezas.
Se observa que de las importaciones que realizó México del 2018 a 2022, alrededor del 50% fueron de Estados Unidos. También, se encontró que México tiene una tendencia a lo largo de los años en cuestiones producción automotriz, exportaciones e importaciones. México tiene una mayor producción local de la que importa y exporta; así mismo, exporta más productos de la industria automotriz de los que importa. El tamaño de mercado de la industria automotriz en México ha ido fluctuando a través de los años; sin embargo, muestra una tendencia a la alza. En 2018 el tamaño de mercado era de 77% y en 2022 esta cifra aumentó a 79.7%. En cuanto al tipo de cambio, se ha mantenido entre 19.22 y 20.4.
En cuanto a las Exportaciones de piezas de EE. UU, se observó que México ha sido el principal país al que EU le ha exportado desde el 2018 (con un promedio de 29,584,281,308 piezas), seguido por Canadá y China. En cuanto a la producción anual de vehículos de motor y ventas internas en EE. UU. (miles de unidades). Se observa que en los últimos 20 años EE.UU. ha producido y vendido más vehículos comerciales que carros para pasajeros. En 2021, produjo 1, 563,000 carros de pasajeros, y 7,594,000 carros comerciales. Y vendió 2,376,000 carros de pasajeros, y 9,455 carros comerciales.
Amenazas:
La dependencia de las importaciones de Estados Unidos: México importa un alto porcentaje de partes automotrices de EE.UU. si llegará a haber algún cambio en una política comercial o en la relación entre los dos países, eso afectaría en gran cantidad a México.
El tipo de cambio: Si la moneda mexicana se deprecia, eso podría afectar significativamente los costos de producción y las exportaciones.
Competencia internacional: China y Alemania tienen una gran presencia en la importación y exportación de autopartes y vehículos, esos países y otros pueden ser competencia del mercado internacional para México.
Oportunidades:
Crecimiento de la industria: La tendencia en aumento del mercado de la industria automotriz, es una oportunidad para que México crezca en la industria y aporté más valor al desarrollo económico del país.
Relación con Estados Unidos: Ya que EE.UU. exporta principalmente a México piezas de automóviles, existe la oportunidad de seguir fortaleciendo la relación comercial entre estos dos países.
Vehículos comerciales: Estados Unidos produce y vende más vehículos comerciales que carros para pasajeros, México podría diversificar su producción de automóviles para que se asocie con EE.UU. en el comercio de los vehículos comerciales y tenga mayores ventas.
Producción local: México ha tenido una mayor producción local que importaciones y exportaciones automotrices en los últimos años, puede aprovechar esto para aumentar la producción manufacturera dentro del país y aumentar su autonomía para no depender tanto de otros países.
Situación problema Recursos Humanos
La empresa FORM experimenta una alta tasa de abandono de empleo al tener de 1 a 4 bajas diarias, la falta de personal provoca mayor gasto en el área de Recursos Humanos ya que los procesos de reclutamiento se vuelven repetitivos, FORM además de su propia área de Recursos Humanos ha contratado otras 3 empresas para mejorar su proceso de reclutamiento. Debemos identificar las razones del abandono de empleo ya que se han tomado medidas como aumento de sueldos, mejores prestaciones o mejores condiciones laborales sin embargo estas no han tenido éxito.
Situación problema Pronóstico de Demanda
La empresa FORM ha presentado desafíos operativos, la variabilidad de la demanda de sus clientes sumado con el problema de rotación de empleados que tiene ha ocasionado problemas para tener una buena eficiencia operativa, pronosticando la demanda de sus productos FORM puede tener una mejor planificación de compra de materia prima, capacidad de personal o de producto terminado y aumentar la eficiencia y capacidad operativa lo que se verá traducido en mayores ganancias.
Elecciones políticas: 2024 es un año donde en México hay elecciones políticas para determinar al próximo presidente por lo que es algo que tenemos que tomar en cuenta, una de las principales consecuencias que tenemos es la incertidumbre en el mercado, no sabemos si tendremos un mejor escenario o un escenario desfavorable, el resultado de las elecciones puede traer como consecuencia cambios en la inversión, cambios en las relaciones exteriores entre muchas cosas más por lo que es algo que se debe tomar en cuenta para tener la capacidad de adaptarse a la nueva realidad.
Nearshoring: México es uno de los países que pueden sacar una mejor ventaja de este fenómeno, después de la pandemia covid-19 y el colapso de varias cadenas de suministros el fenómeno nearshoring se volvió más fuerte, la posición geográfica de méxico lo hace un excelente candidato para reubicar cadenas de suministros ya que se encuentra cerca de los principales destinos finales de las producciones, como si fuera poco México cuenta con una mano de obra barata y también es uno de los países con más tratados y acuerdos comerciales, algunas ventajas que tendría México gracias a este fenómeno es el crecimiento de su economía en un 3.5% anual y un aumento de inversión de un 7.5% aprox, pero así como existen ventajas y beneficios México cuenta con una serie de problemas que podrían afectar a este fenómeno, los problemas sociales, crimen organizado, corrupción entre otros, pero el verdadero problema es si México cuenta con la infraestructura necesaria como transporte, aeropuertos, energías limpias que permitan a las empresas reubicar sus cadenas de suministros en nuestro país.
Autopartes: Se estima que en 2024 se reciban más de 2 mil 300 millones de dólares en inversión en el sector de autopartes en México, más del 14% de lo que se recibió en 2023, Alemania y Japón son los dos países con más inversión en nuestro país.
En enero de 2024 se exportaron más de 250 mil autos ensamblados, esta es una cifra jamás antes vista en el país, Estados Unidos es el mejor socio de México, para dimensionar esta asociación 8 de cada 10 autos exportados terminan en el mercado de Estados Unidos.
Autos eléctricos: En 2023 se superó la producción de más de 100 mil autos eléctricos lo que significa que el año pasado el mercado de estos coches creció en un 36%, se espera que en 2024 aumente este crecimiento ya que marcas como Toyota, Tesla (Nuevo León) y BMX (San Luis Potosí) están por iniciar producción de autos eléctricos en nuestro país en 2024.
La transición a los autos eléctricos es una estrategia de la industria mexicana ya que se quiere lograr una reducción del 45% de las emisiones de CO2 para el año 2050.
Leyes laborales: En México las leyes laborales regulan la relación entre los empleados y las empresas, existen leyes ya establecidas, algunas de las más importantes son: La Ley Federal del Trabajo (LFT), La Ley de la Seguridad Social (LSS), La Ley de la Responsabilidad Social Empresarial (LRS), por otra parte con desde el primer dia de enero de 2024 el salario mínimo aumentó un 20% y nadie puede ganar menos de 7,468 pesos al mes y por ley no se puede trabajar más de 8 horas por jornada laboral.
Energías limpias: México es un jugador nuevo en este sector ya que apenas en 2025 se aprobó la ley que permite la participación de energías limpias o renovables, aproximadamente un 20% de la energía utilizada en México viene de energías verdes siendo la energía hidroeléctrica la más utilizada con un 8%, si nos situamos a la ubicación del socio formador nos podemos encontrar un problema, actualmente Nuevo León enfrente problemas ambientales muy grandes, la contaminación atmosférica es uno de ellos y la presencia de industrias como la refinería de Cadereyta aumentan este problema cada día más, la contaminación de la atmósfera no solo afecta a la calidad del aire también puede afectar la sustentabilidad en la región a un mediano plazo, por lo que es necesario una transición a energías limpias, las empresas juegan un papel fundamental en esta transición ya que deben desempeñar actividades sostenibles dentro de sus procesos.
Reciclaje de cartón: Como menciona la secretaría de medio ambiente y recursos naturales de México aproximadamente se desechan más de 2.5 millones de toneladas de papel y cartón al año lo que implica tala de árboles y procesos químicos que utiliza el cartón para ser fabricado, afortunadamente México en los últimos años ha estado consciente de que el reciclaje es una parte fundamental para la conservación del medio ambiente y ya cuenta con plantas recicladoras, un ejemplo es la planta recicladora de pet más grande de América Latina.
Elecciones políticas: Al igual que en México, en el primer semestre del 2024 serán las elecciones en este país. Actualmente, Joe Biden publicó la Ley de Reducción de la Inflación, en la que se otorgan estímulos fiscales a los consumidores de coches eléctricos pero también a las armadoras. Dependiendo del ganador de las elecciones de este año, dichos incentivos pueden desaparecer, y tendría un impacto en México.
Nearshoring: Estados Unidos se beneficia del 76% dentro del 90% del total de producción de vehículos. Dichas exportaciones mexicanas a Estados Unidos incluyen productos como camiones ligeros, vehículos de pasajeros y piezas de automóviles. Igualmente se benefician de las habilidades técnicas y la rentabilidad de obra mexicana, una programación de producción simplificada dentro de una zona horaria simplificada y tiempos reducidos de transportes para materias primas y bienes.
Algunos otros factores que influyen en que más empresas de Estados Unidos se sitúen en México son: las difíciles relaciones que tienen con China, el T-MEC que facilita el comercio de EU, México y Canadá, la proximidad de ambos países, los bajos costos laborales en México, las cadenas de suministros rápidas y seguras, el buen desempeño de la industria nacional, sobre todo en la industria automotriz.
La facilidad de nearshoring de México a Estados Unidos puede afectar a las empresas mexicanas debido a la alta competencia que traería.
Autopartes: Existe una gran cantidad de empresas que invierten en México para la fabricación de autopartes, de las cuales el 28% son de Estados Unidos. El comercio de autopartes con Estados Unidos ha sido estratégico para el crecimiento de la industria a pesar del impacto que tuvo la huelga automotriz en 2023.
Autos eléctricos: Estados Unidos es el mayor fabricante de coches híbridos y eléctricos de América del norte y como consecuencia el país también es el principal mercado para estos coches.
En estados Unidos la tasa de lealtad a los coches eléctricos han bajado, aproximadamente el 48% de los conductores de autos eléctricos volverían a los coches de gasolina en su próxima compra, Estados Unidos está muy por detrás de Países como China en el uso de autos eléctricos, aunque existen estados como California donde se está desarrollando más rápido este nuevo segmento.
Leyes laborales: Actualmente se cuentan con leyes como Ley de Normas Justas de Trabajo, donde establece salario mínimo federal, regula el pago de horas extras, y establece estándares para el empleo de menores de edad. Ley Nacional de Relaciones Laborales, la cual protege el derecho de los empleados a organizarse y negociar colectivamente a través de sindicatos. Es relevante mencionar que en 2023 hubo una huelga en donde trabajadores de la industria automotriz piden un salario justo.
Igualmente, Biden promueve la Ley de Reducción de Inflación, la cual impulsa a los fabricantes de vehículos a acelerar la producción de vehículos limpios.
Acción Climática: Estados Unidos se encuentra dentro del acuerdo USMCA el cual incluye un nuevo capítulo sobre el medio ambiente y disposiciones para reducir la contaminación y promover el uso de energías renovables. Estas medidas están diseñadas para que la industria automotriz y metalmecánica sea más sostenible y competitiva a nivel mundial. Algunas medidas incluyen: que se adopten estándares comunes de emisiones para los vehículos, promocionen el uso de energías renovables y establece un nuevo fondo para apoyar a las empresas de la industria automotriz y metalmecánica a desarrollar nuevas tecnologías que reduzcan su impacto ambiental.
Reciclaje de cartón: Las cajas de cartón son el material de empaquetado más reciclado en Estados Unidos. En 2022, la tasa de reciclaje de cajas de cartón fue superior al 93%, un aumento con respecto a la tasa del año pasado.
Diversificación de productos: Aprovechando factores como el Nearshoring o la creciente inversión extranjera en el sector de autopartes, introducir nuevos tipos de empaques o nuevos productos que puedan ser llamativos para estas industrias que se encuentra en tendencia creciente, como se puede apreciar en el PESTLE estos factores provocan que más empresas lleguen al mercado por lo que tener más variedad de producto puede ser una oportunidad de expansión o consolidación en el mercado.
Monitoreo del mercado: Al tener una industria en crecimiento, surgirán nuevos competidores por lo que tienes que saber cual es tu valor agregado el cual te diferencia de tu competencia, mantener tu producto actualizado para satisfacer las necesidades y exigencias del mercado.
# setting time series format
Nearshoring$Fecha=as.yearqtr(Nearshoring$Fecha,format="%Y/%q")
# time series plot
IEDxts<-xts(Nearshoring$IED_REAL,order.by=Nearshoring$Fecha)
dygraph(IEDxts, main = "Foreign Direct Investment Flows") %>%
dyOptions(colors = RColorBrewer::brewer.pal(4, "Dark2"))
IEDts<-ts(Nearshoring$IED_REAL,frequency=4,start=c(1999,1))
IED_ts_decompose<-decompose(IEDts)
plot(IED_ts_decompose)
# Stationary Test
# H0: Non-stationary and HA: Stationary. p-values < 0.05 reject the H0.
adf.test(IEDts)
##
## Augmented Dickey-Fuller Test
##
## data: IEDts
## Dickey-Fuller = -4.3846, Lag order = 4, p-value = 0.01
## alternative hypothesis: stationary
# Serial Autocorrelation
acf(IEDts,main="Significant Autocorrelations")
summary(IED_ARIMA<-arima(IEDts,order=c(0,0,0),seasonal = c(2,0,0)))
##
## Call:
## arima(x = IEDts, order = c(0, 0, 0), seasonal = c(2, 0, 0))
##
## Coefficients:
## sar1 sar2 intercept
## 0.1779 0.2418 231.3254
## s.e. 0.0977 0.0975 117.4993
##
## sigma^2 estimated as 501382: log likelihood = -790.52, aic = 1589.05
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE ACF1
## Training set 6.741251 708.083 372.0404 -20.35875 346.8635 0.6136686 -0.02059352
### Residuals are stationary ?
IED_ARIMA_residuals<-IED_ARIMA$residuals
adf.test(na.omit(IED_ARIMA_residuals))
##
## Augmented Dickey-Fuller Test
##
## data: na.omit(IED_ARIMA_residuals)
## Dickey-Fuller = -4.8948, Lag order = 4, p-value = 0.01
## alternative hypothesis: stationary
# ADF test suggest that ARMA residuals are stationary since p-value is < 0.05.
### Residuals show serial autocorrelation ?
Box.test(IED_ARIMA_residuals,lag=3,type="Ljung-Box")
##
## Box-Ljung test
##
## data: IED_ARIMA_residuals
## X-squared = 0.33711, df = 3, p-value = 0.9529
temp_forecast<-autoplot(forecast(IED_ARIMA))
plot(temp_forecast)
forecast(IED_ARIMA,h=5)
## Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
## 2023 Q4 118.270281 -789.1746 1025.7152 -1269.5469 1506.087
## 2024 Q1 63.172197 -844.2727 970.6171 -1324.6450 1450.989
## 2024 Q2 428.659330 -478.7856 1336.1042 -959.1579 1816.477
## 2024 Q3 257.420849 -650.0240 1164.8657 -1130.3963 1645.238
## 2024 Q4 7.801777 -913.8885 929.4921 -1401.8019 1417.405
1- ¿En qué año hubo más renuncias?
2- ¿Hay factores en común entre los empleados que no abandonan el
empleo?
3- ¿Hay factores en común entre los empleados que abandonan el
empleo?
4- ¿En qué área de la empresa han sucedido más bajas?
nas_por_columna <- colSums(is.na(df_n))
nas_por_columna
## Antiguedad_meses Razon_ingreso Percepcion_salario Prestaciones
## 0 0 0 0
## Jornada_laboral Herramientas Temperatura Estres_nivel
## 0 0 0 0
## Transporte Zona_trabajo Sigue_trabajando situacion_conflicto
## 0 0 0 0
## Insatisfaccion Percepcion Edad Genero
## 0 0 0 0
## Estado_civil Municipio Escolaridad Depend_econom
## 0 0 0 0
## Puesto
## 0
nas_por_columna <- colSums(is.na(df_c))
nas_por_columna
## Antiguedad_meses Razon_ingreso Percepcion_salario Prestaciones
## 0 0 0 0
## Jornada_laboral Herramientas Temperatura Estres_nivel
## 0 0 0 0
## Transporte Zona_trabajo Sigue_trabajando situacion_conflicto
## 0 0 0 0
## Insatisfaccion Percepcion Edad Genero
## 0 0 0 0
## Estado_civil Municipio Escolaridad Depend_econom
## 0 0 0 0
## Puesto
## 0
Nos aseguramos que no haya valores faltantes en el dataframe.
library(psych)
describe(df_n)
## vars n mean sd median trimmed mad min max range
## Antiguedad_meses 1 103 13.61 14.35 7 12.43 8.90 1 36 35
## Razon_ingreso 2 103 3.96 1.71 4 4.07 2.97 1 6 5
## Percepcion_salario 3 103 3.80 1.34 4 3.99 1.48 1 5 4
## Prestaciones 4 103 3.29 1.54 4 3.36 1.48 1 5 4
## Jornada_laboral 5 103 4.17 1.25 5 4.42 0.00 1 5 4
## Herramientas 6 103 3.90 1.55 5 4.12 0.00 1 5 4
## Temperatura 7 103 3.11 1.71 3 3.13 2.97 1 5 4
## Estres_nivel 8 103 3.72 1.38 4 3.89 1.48 1 5 4
## Transporte 9 103 4.01 1.51 5 4.25 0.00 1 5 4
## Zona_trabajo 10 103 4.33 1.22 5 4.63 0.00 1 5 4
## Sigue_trabajando 11 103 4.02 1.29 5 4.25 0.00 1 5 4
## situacion_conflicto 12 103 1.17 0.40 1 1.07 0.00 1 3 2
## Insatisfaccion* 13 103 42.61 23.17 44 43.41 29.65 1 79 78
## Percepcion* 14 103 23.21 17.02 15 21.82 14.83 1 59 58
## Edad 15 103 35.49 12.23 33 34.70 13.34 18 68 50
## Genero 16 103 1.35 0.48 1 1.31 0.00 1 2 1
## Estado_civil 17 103 1.95 1.11 2 1.82 1.48 1 4 3
## Municipio 18 103 1.76 1.43 1 1.41 0.00 1 6 5
## Escolaridad 19 103 2.44 1.02 3 2.39 1.48 1 5 4
## Depend_econom 20 103 1.07 1.09 1 0.96 1.48 0 3 3
## Puesto 21 103 1.67 0.80 1 1.59 0.00 1 3 2
## skew kurtosis se
## Antiguedad_meses 0.67 -1.28 1.41
## Razon_ingreso -0.47 -1.20 0.17
## Percepcion_salario -0.94 -0.39 0.13
## Prestaciones -0.28 -1.48 0.15
## Jornada_laboral -1.40 0.78 0.12
## Herramientas -1.06 -0.53 0.15
## Temperatura -0.14 -1.71 0.17
## Estres_nivel -0.73 -0.75 0.14
## Transporte -1.16 -0.35 0.15
## Zona_trabajo -1.81 2.01 0.12
## Sigue_trabajando -1.15 0.14 0.13
## situacion_conflicto 2.23 4.20 0.04
## Insatisfaccion* -0.20 -1.17 2.28
## Percepcion* 0.65 -0.98 1.68
## Edad 0.48 -0.90 1.21
## Genero 0.62 -1.63 0.05
## Estado_civil 0.94 -0.54 0.11
## Municipio 1.80 2.07 0.14
## Escolaridad 0.17 -0.45 0.10
## Depend_econom 0.50 -1.14 0.11
## Puesto 0.65 -1.14 0.08
Aquí se observan por cada variable valores como: promedio, desviación estándar, mediana, min, max, etc.
#Aquí calculé de la variable Antiguedad_meses sus medidas de dispersión.
media <- mean(df_n$Antiguedad_meses)
media # 13.61165
## [1] 13.61165
desviacion_estandar <- sd(df_n$Antiguedad_meses)
desviacion_estandar # 14.34534
## [1] 14.34534
coeficiente_variacion <- (desviacion_estandar / media) * 100
coeficiente_variacion #105.3902
## [1] 105.3902
rango <- range(df_n$Antiguedad_meses)
rango #1 36
## [1] 1 36
varianza <- var(df_n$Antiguedad_meses)
varianza # 205.7889
## [1] 205.7889
La variable dependiente es Antiguedad_meses y sus medidas de
dispersión son las siguientes:
* Media: 13.61165
* Desviación estándar: 14.34534
* Coeficiente de variación: 105.3902
* Rango: 1 36
* Varianza: 205.7889
Estos datos podemos interpretarlos de la siguiente manera:
* Los empleados tienen una antigüedad promedio de 13.6 meses.
* Los valores están dispersos en aprox. 14 meses de la media.
* Hay una alta variabilidad en relación con la media.
* La antigüedad de los empleados es desde 1 mes hasta 36 meses.
* La varianza nos dice que los valores varían en 205 meses al cuadrado
respecto a la media.
## [,1]
## Antiguedad_meses 1.000000000
## Razon_ingreso -0.098276978
## Percepcion_salario -0.110373225
## Prestaciones 0.129066759
## Jornada_laboral -0.005125116
## Herramientas 0.060019295
## Temperatura 0.074649577
## Estres_nivel -0.104466536
## Transporte 0.098300633
## Zona_trabajo 0.018102147
## Sigue_trabajando 0.255070305
## situacion_conflicto 0.182841453
## Edad 0.304281259
## Genero 0.007103936
## Estado_civil -0.020808305
## Municipio -0.007023634
## Escolaridad 0.095142518
## Depend_econom 0.110476284
## Puesto 0.196213192
En la matriz de correlación vemos que la variable dependiente “Antiguedad_meses” se correlaciona en gran manera con las variables de: Sigue_trabajando y Edad.
Esto significa que, mientras más antigüedad tenga un empleado, es más probable que siga trabajando en FORM y que tenga más edad.
La variable Puesto también tiene una correlación positiva con Antiguedad_meses, aunque en menor medida, esto significa que, el puesto que ocupe un colaborador también influye en su antigüedad dentro de la empresa.
Las variables: Razon_ingreso, Percepcion_salario, Estres_nivel y Estado_civi están correlacionadas negativamente con Antiguedad_meses, pero esta correlación es muy baja.
## $`1`
##
## $`2`
##
## attr(,"class")
## [1] "list" "ggarrange"
Se observa que las variables: Transporte, Sigue_trabajando, Herramientas, Jornada_Laboral, Zona_trabajo y Estres_nivel presentan un sesgo a la izquierda.
Y las variables: Puesto, Genero, Estado_civil, Situacion_conflicto y Depend.econom presentan un sesgo a la derecha.
Se observa que la mayor parte de los trabajadores son mujeres.
Se observa que la mayoría de los empleados residen en el Municipio de Apodaca, seguido por Juárez.
Se observa que la mayoría de los colaboradores cuentan con una escolaridad de Secundaria, seguida por Preparatoria, Licenciatura, Primaria y Otro.
La mayor parte de los colabroadores se ubican entre los 20 y 30 años.
La mayoría de los empleados ocupan puestos de Producción (Costurera, Ayudante General, Soldador).
La mayoría de los colaboradores son solteros, seguidos por un estado civil de casado, unión libre y divorciado.
La mayoría de los trabajadores no se sienten estresados durante su jornada laboral.
Con base en las respuestas de la variable Percepcion, se observa que la mayoría de los empleados de FORM sienten alegría y confianza.
##
## Femenino Masculino Sum
## No 56 31 87
## Prefiero no decirlo 1 0 1
## Si 10 5 15
## Sum 67 36 103
Se observa que de los empleados actuales 15 de 103 han experimentado acoso, conflicto o se han sentido inseguros dentro de la empresa. Y 10 de esos 15 casos han sido mujeres.
##
## Ambiente de trabajo Otro Por el salario Prestaciones
## Femenino 8 12 12 1
## Masculino 4 9 7 1
## Sum 12 21 19 2
##
## Razones personales Ubicación de la empresa Sum
## Femenino 14 20 67
## Masculino 5 10 36
## Sum 19 30 103
Se observa que la razón por la que entraron a trabajar la mayoría de los colaboradores a FORM (30 de 103) fue por la ubicación de la empresa. Las mujeres entraron a trabajar más que los hombres por razones de Ambiente de trabajo, salario y razones personales.
##
## Medianamente de acuerdo Medianamente en desacuerdo
## 20 5
## Ni de acuerdo ni en desacuerdo Totalmente de acuerdo
## 15 54
## Totalmente en desacuerdo
## 9
Se observa que de los actuales trabajadores de FORM, poco más de la mitad planea seguir trabajando en la empresa (54 de 103), mientras que 9 de los 103 encuestados planean no seguir laborando en FORM.
## Motivo de Baja Puesto Dpto SD Estado_Civil
## 112 0 254 0 0
## Genero Año Estado Municipio Dias_trabajados
## 0 0 0 0 112
## Meses Edad
## 112 0
Dado que hay NA’s en Dias_trabajados y Meses, se sustituirán los NA por la mediana de cada variable.
# Calcular la mediana de las variables correspondientes
mediana_dias_trabajados <- median(bajas$Dias_trabajados, na.rm = TRUE)
mediana_meses <- median(bajas$Meses, na.rm = TRUE)
# Reemplazar los NA por la mediana en las columnas correspondientes
bajas <- bajas %>%
mutate(Dias_trabajados = ifelse(is.na(Dias_trabajados), mediana_dias_trabajados, Dias_trabajados),
Meses = ifelse(is.na(Meses), mediana_meses, Meses))
summary(bajas)
## Motivo de Baja Puesto Dpto SD
## Length:391 Length:391 Length:391 Min. :144.4
## Class :character Class :character Class :character 1st Qu.:180.7
## Mode :character Mode :character Mode :character Median :217.6
## Mean :200.2
## 3rd Qu.:217.6
## Max. :337.1
##
## Estado_Civil Genero Año Estado
## DIVORCIO : 3 FEMENINO :206 2022:112 COAHUILA : 21
## MATRIMONIO :117 MASCULINO:185 2023:279 NUEVO LEÓN:370
## SOLTERIA :184
## UNION LIBRE: 87
##
##
##
## Municipio Dias_trabajados Meses Edad
## APODACA :265 Min. : 1.00 Min. : 1.000 Min. :18.00
## PESQUERIA : 39 1st Qu.: 13.00 1st Qu.: 1.000 1st Qu.:23.00
## JUAREZ : 38 Median : 22.00 Median : 1.000 Median :30.00
## GUADALUPE : 17 Mean : 72.28 Mean : 2.898 Mean :32.89
## RAMOS ARIZPE: 15 3rd Qu.: 54.00 3rd Qu.: 2.000 3rd Qu.:41.00
## MONTERREY : 6 Max. :1861.00 Max. :63.000 Max. :74.00
## (Other) : 11
describe(bajas)
## vars n mean sd median trimmed mad min max
## Motivo de Baja* 1 279 4.80 0.85 5.00 5.00 0.00 1.00 5.00
## Puesto* 2 391 8.70 6.69 6.00 6.80 0.00 1.00 31.00
## Dpto* 3 137 13.43 6.86 16.00 13.54 7.41 1.00 24.00
## SD 4 391 200.16 23.65 217.64 202.12 0.00 144.45 337.05
## Estado_Civil* 5 391 2.91 0.74 3.00 2.89 1.48 1.00 4.00
## Genero* 6 391 1.47 0.50 1.00 1.47 0.00 1.00 2.00
## Año* 7 391 1.71 0.45 2.00 1.77 0.00 1.00 2.00
## Estado* 8 391 1.95 0.23 2.00 2.00 0.00 1.00 2.00
## Municipio* 9 391 2.66 2.58 1.00 2.21 0.00 1.00 10.00
## Dias_trabajados 10 391 72.28 168.61 22.00 34.09 17.79 1.00 1861.00
## Meses 11 391 2.90 5.64 1.00 1.57 0.00 1.00 63.00
## Edad 12 391 32.89 11.44 30.00 31.68 11.86 18.00 74.00
## range skew kurtosis se
## Motivo de Baja* 4.0 -4.09 15.11 0.05
## Puesto* 30.0 2.32 3.97 0.34
## Dpto* 23.0 -0.28 -1.27 0.59
## SD 192.6 0.06 1.95 1.20
## Estado_Civil* 3.0 0.03 -0.91 0.04
## Genero* 1.0 0.11 -1.99 0.03
## Año* 1.0 -0.94 -1.12 0.02
## Estado* 1.0 -3.94 13.59 0.01
## Municipio* 9.0 1.14 -0.22 0.13
## Dias_trabajados 1860.0 5.67 42.71 8.53
## Meses 62.0 5.70 43.29 0.29
## Edad 56.0 0.80 -0.21 0.58
Aquí se observan por cada variable valores como: promedio, desviación estándar, mediana, min, max, etc.
#Aquí calculé de la variable Dias_trabajados sus medidas de dispersión.
media <- mean(bajas$Dias_trabajados)
media # 72.27621
## [1] 72.27621
desviacion_estandar <- sd(bajas$Dias_trabajados)
desviacion_estandar # 168.6122
## [1] 168.6122
coeficiente_variacion <- (desviacion_estandar / media) * 100
coeficiente_variacion # 233.2886
## [1] 233.2886
rango <- range(bajas$Dias_trabajados)
rango # 1 1861
## [1] 1 1861
varianza <- var(bajas$Dias_trabajados)
varianza # 28430.06
## [1] 28430.06
La variable dependiente es Dias_trabajados y sus medidas de
dispersión son las siguientes:
* Media: 72.27621
* Desviación estándar: 168.6122
* Coeficiente de variación: 233.2886
* Rango: 1 1861
* Varianza: 28430.06
Estos datos podemos interpretarlos de la siguiente manera:
* Los antiguos empleados llevaban en promedio de 72 días
trabajando.
* Los valores están dispersos en aprox. 168 días de la media.
* Hay una alta variablilidad en relación con la media.
* Los días trabajados de los antiguos empleados van desde 1 día hasta
1861 días.
* La varianza nos dice que los valores varían en 28430 días al cuadrado
respecto a la media.
En esta gráfica se puede observar la distribución de bajas segmentadas por salario diario, donde es notoria una tendencia hacia valores menores. El comportamiento de esta variable es muy marcado, la mediana se encuentra en $217.6, siendo este el mismo valor encontrado en el 3er cuartil, haciendo que los valores que se encuentren después del grupo más frecuente del histograma se puedan hasta considerar valores atípicos.
En esta gráfica se puede observar que no existe una alta diferencia de género en las bajas registradas en 2022 y 2023, por lo que se puede inferir que no serían altamente significativas para la clasificación por si solas. Estas variables pueden tener mayor impacto considerando en conjunto otras variables como Estado Civil y/o Edad.
En esta gráfica se puede observar que existe una tendencia para el estado civil de soltera/o para ser una baja, mientras que existen muy pocos registros de personas divorciadas siendo bajas en la empresa. Se podría realizar un análisis con más variables.
En el histograma de Edad podemos observar que la variable no cuenta con una distribución normal, sino que tiene un sesgo de cola derecha, haciendo clara la diferencia de bajas entre los grupos de edades, siendo más común tener una baja de personal entre 20-30 años de edad. Sería interesante analizar cuestiones generacionales y su respuesta hacia ciertas compensaciones.
Se observa que de las personas que renuncian en Monterrey, la mediana es de alrededor de 55 años. En los demás Municipios las personas que renuncian tienen una edad más pequeña (entre 20 y 40 años), son más jóvenes.
Se observa que tanto hombres como mujeres tienen una mediana similar en la cantidad de meses a los que renuncian.
Se observa que las personas solteras duran un poco más antes de renuciar que las personas que están casadas o en unión libre. Cabe resaltar que, la diferencia de días entre los que renuncia una persona soltera y alguien con otro estado civil difiere en muy poca cantidad. También, es importante resaltar que son muy pocas personas divorciadas que han renunciado.
El departamento de calidad es el departamento con más número de bajas. Su número de bajas es bastante significativo en comparación con los otros departamentos.
##
## FEMENINO MASCULINO Sum
## Inducida 4 8 12
## Inducida (Faltas no dio los tiempos) 1 0 1
## Inducida (Faltas) 0 2 2
## Inducida. 1 0 1
## Separacion voluntaria 140 123 263
## Sum 146 133 279
Se observa que el principal motivo de renuncia fue separación voluntaria tanto para hombres como para mujeres.
##
## 2022 2023
## 112 279
Se observa que hubo más renuncias en 2023, de hecho, la cantidad de bajas fue más del doble que en 2022.
colSums(is.na(ventas))
## Fecha Carton Retornable Servicios Total
## 0 15 15 24 3
summary(ventas)
## Fecha Carton Retornable
## Min. :2020-01-01 00:00:00 Min. :4247178 Min. : 182166
## 1st Qu.:2020-09-23 12:00:00 1st Qu.:5109380 1st Qu.: 892584
## Median :2021-06-16 00:00:00 Median :5967880 Median :1238011
## Mean :2021-06-16 10:40:00 Mean :6065727 Mean :1981658
## 3rd Qu.:2022-03-08 18:00:00 3rd Qu.:6823014 3rd Qu.:3200035
## Max. :2022-12-01 00:00:00 Max. :8873296 Max. :5304410
## NA's :15 NA's :15
## Servicios Total
## Min. : 13500 Min. : 2235669
## 1st Qu.: 38945 1st Qu.: 6358278
## Median : 99213 Median : 7872345
## Mean : 368072 Mean : 7841740
## 3rd Qu.: 509159 3rd Qu.: 9219847
## Max. :1375979 Max. :12285123
## NA's :24 NA's :3
range(na.omit(ventas$Total))
## [1] 2235669 12285123
sd(na.omit(ventas$Total))
## [1] 2227534
var(na.omit(ventas$Total))
## [1] 4961909722941
median(na.omit(ventas$Total))
## [1] 7872345
median(na.omit(ventas$Carton))
## [1] 5967880
median(na.omit(ventas$Retornable))
## [1] 1238011
median(na.omit(ventas$Servicios))
## [1] 99212.5
range(na.omit(ventas$Carton))
## [1] 4247178 8873296
range(na.omit(ventas$Retornable))
## [1] 182166 5304410
range(na.omit(ventas$Servicios))
## [1] 13500 1375979
Estos datos podemos interpretarlos de la siguiente manera:
* Las ventas totales promedio son de $7, 872, 345.
* Los valores están dispersos en aprox. $2, 227, 534 de la media.
* Las ventas van desde los $2,235,669 hasta los $12,285,123 por mes
entre 2020-2022.
numeric_columns <- sapply(ventas, is.numeric)
numeric_data <- ventas[, numeric_columns]
correlation_matrix <- cor(na.omit(numeric_data))
corrplot(correlation_matrix)
La variable con mayor correlación al total de ventas es el cartón.
# Crear un histograma de ventas por mes
ggplot(ventas, aes(x = ventas$Fecha,"%Y", y = ventas$Carton)) +
geom_bar(stat = "identity", fill = "orange") +
labs(title = "Ventas de Carton por Mes",
x = "Mes",
y = "Ventas Carton") +
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1)) +
scale_y_continuous(labels = scales::comma) +
theme_minimal()
Aunque podemos notar que en 2022 aumentaron las ventas en cartón, siguen habiendo fluctuaciones conforme pasan los meses.
# Calcular la suma de las ventas de cada producto
suma_ventas <- colSums(ventas[, c("Carton", "Retornable", "Servicios")], na.rm = TRUE)
# Crear un dataframe con los totales de ventas para cada producto
ventas_totales <- data.frame(producto = names(suma_ventas), ventas = suma_ventas)
colores_naranjas <- c("#FFA500", "#FF7F50", "#FDFD96") # Puedes ajustar estos códigos de color según tus preferencias
# Crear el gráfico con la paleta de colores naranjas
ggplot(ventas_totales, aes(x = "", y = ventas, fill = producto)) +
geom_col(width = 1) +
coord_polar(theta = "y") +
labs(title = "Comparación de Ventas Totales",
fill = "Producto",
x = NULL,
y = NULL) +
scale_fill_manual(values = colores_naranjas) + # Usar la paleta de colores naranjas definida anteriormente
theme_minimal() +
theme(axis.text.x = element_blank(),
axis.ticks.x = element_blank())
Las ventas totales se distribuyen en aproximadamente 75% de cartón, y el resto en retornable y servicios respectivamente.
# Separar el año de la columna de fecha
ventas$Año <- format(ventas$Fecha, "%Y")
# Calcular las ventas totales por año
ventas_por_año <- ventas %>%
group_by(Año) %>%
summarise(ventas_totales = sum(na.omit(Retornable)))
# Crear un histograma de ventas por año
ggplot(ventas_por_año, aes(x = Año, y = ventas_totales)) +
geom_bar(stat = "identity", fill = "orange") +
labs(title = "VENTAS DE RETORNABLE POR AÑO",
x = "AÑO",
y = "SUMA DE RETORNABLE") +
scale_y_continuous(labels = scales::comma) +
theme_minimal()
Es importante tomar en cuenta que en 2022 no tenemos los datos de los últimos 3 meses. Sin embargo, las ventas de retornables es notablemente mayor en 2021.
# Ajustar un modelo de regresión lineal
modelo <- lm(Total ~ Carton + Retornable + Servicios, data = ventas)
# Hacer predicciones
nuevos_datos <- data.frame(Carton = c(5000000, 6000000,7000000), Retornable = c(1000000, 2000000, 3000000), Servicios = c(100000,500000,1000000))
predicciones <- predict(modelo, newdata = nuevos_datos)
# Mostrar las predicciones
print(predicciones)
## 1 2 3
## 6062916 8432782 10906212
Las preguntas de análisis fueron las siguientes:
En el 2023 (279 bajas) hubo más bajas en comparación con el año 2022 (112 bajas).
FORM. “The Form Way -.” Form, 23 Aug. 2021, form.com.mx/the-form-way/ Accessed 7 Mar. 2024.
Navarrete, F. (2024, 8 febrero). México ‘se pone las pilas’: producción de autos eléctricos acelera 36%. El Financiero. Recuperado 7 de marzo de 2024, de https://www.elfinanciero.com.mx/empresas/2024/02/07/mexico-se-pone-las-pilas-produccion-de-autos-electricos-acelera-36/
Plerk. (2023, 30 enero). 3 leyes laborales en México que debes conocer. El Economista. Recuperado 7 de marzo de 2024, de https://es.linkedin.com/pulse/3-leyes-laborales-en-m%C3%A9xico-que-debes-conocer-plerk
Anónimo (2024). Lissely Ancira: Transformando el horizonte energético de Nuevo Leon. El financiero. Recuperado de :https://www.elfinanciero.com.mx/monterrey/2024/01/26/lissely-ancira-transformando-el-horizonte-energetico-de-nuevo-leon/
Israel Zamarrón (Octubre 2023). Nearshoring en México: estos son los beneficios que podría obtener el país a 2030. Forbes México. Recuperado de: https://www.forbes.com.mx/nearshoring-en-mexico-estos-son-los-beneficios-que-podria-obtener-el-pais-a-2030/
Anónimo.(2023). Energia verde, soluciones disponibles en México. Enel, recuperado de: https://www.enel.mx/es/blog/conociendo-el-mercado-energetico/Energia-verde-soluciones-disponibles-en-Mexico
De Luna, T. (2024, 7 febrero). La exportación de autos hechos en México toca una cifra histórica. Expansión. Recuperado 7 de marzo de 2024, de https://expansion.mx/empresas/2024/02/07/exportacion-autos-hechos-mexico-cifra-historica
Cantera, S. (2024, 10 enero). Proyectan fabricar 4.1 millones de autos nuevos durante 2024. El Universal. https://www.eluniversal.com.mx/cartera/proyectan-fabricar-41-millones-de-autos-nuevos-durante-2024/
Thomson Reuters Mexico. (s. f.). Nearshoring: La solución actual para el comercio exterior. https://www.thomsonreutersmexico.com/es-mx/soluciones-de-comercio-exterior/blog-comercio-exterior/nearshoring-la-solucion-actual-para-el-comercio-exteior#:~:text=%C2%BFQu%C3%A9%20es%20nearshoring%3F,con%20una%20zona%20horaria%20semejante.
Martínez, A., Martínez, A., & Martínez, A. (2023, 20 septiembre). ¿Por qué hay una huelga automotriz en Estados Unidos contra GM, Ford y Stellantis? El País México. https://elpais.com/mexico/2023-09-20/por-que-hay-una-huelga-automotriz-en-estados-unidos-contra-gm-ford-y-stellantis.html
Metalmecánica. (2023, 26 julio). Norteamérica en marcha hacia la sostenibilidad automotrizbr. Metalmecánica. https://www.metalmecanica.com/es/noticias/norteamerica-en-marcha-hacia-la-sostenibilidad-automotriz
Teleuniverso. (2024, 3 febrero). Cambios demográficos marcará una era en Estados Unidos. @Teleuniverso. https://teleuniversotv.com/cambios-demograficos-marcara-una-era-en-estados-unidos/
Sociales
Características de la población: La esperanza de vida en nuestro país es de 75.5 años, en Nuevo León se está por encima del promedio de esperanza de vida ya que en el estado la esperanza de vida es de 76. 2 años de edad.
Un gran problema de la sociedad mexicana es la inseguridad y esta no solo afecta en el aspecto social, afecta en la mayoría de aspectos analizados, el crimen organizado, en los últimos 8 años la tasa de crimen organizado ha aumentado más de 60% por lo que es un problema social a tomar en cuenta.