Análisis de datos de oferta laboral para ingenierías en México
Introducción
Es importante conocer la oferta laboral real existente en un país para de esta forma saber que está demandando el sector productivo y así conocer que tipo de áreas de especialización son mejores remuneradas y ponerles un énfasis en las universidades.
Objetivo
El objetivo de este presente estudio es conocer de una manera descriptiva y cuantitativa como es la oferta laboral económica para las carreras de ingeniería en mecatrónica y electromecánica. Para esto se consultaron bases de datos de ofertas de puestos de trabajo en los portales que son: ineed y computrabajo, a continuación se hará una serie de inferencias utilizando los datos recabados.
Paquetes
library(pacman)
p_load("DT","prettydoc","readr")Datos
A continuación veremos en una tabla interactiva los datos a utilizar
setwd("~/pye1pm")
ingenierias <- read_csv("ingenierias2.csv")## Rows: 39 Columns: 11
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (8): Puesto, Perfil, Estado, Ciudad, País, Especialidad, Grado mínimo, F...
## dbl (2): Sueldo bruto mensual, PIBEstado
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
datatable(ingenierias)Análisis exploratorio de los datos
*Resumen estadístico básico
summary(ingenierias)## Puesto Perfil Sueldo bruto mensual Estado
## Length:39 Length:39 Min. : 1300 Length:39
## Class :character Class :character 1st Qu.:13500 Class :character
## Mode :character Mode :character Median :16000 Mode :character
## Mean :17650
## 3rd Qu.:19700
## Max. :50000
## Ciudad País Especialidad Grado mínimo
## Length:39 Length:39 Length:39 Length:39
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## Fuente PIBEstado Poblacion por estado
## Length:39 Min. : 220550 Min. : 1857985
## Class :character 1st Qu.: 469053 1st Qu.: 2822255
## Mode :character Median : 553945 Median : 3769020
## Mean :1058347 Mean : 6471213
## 3rd Qu.:1258572 3rd Qu.: 8348151
## Max. :2848734 Max. :16992418
- Gráfico de caja y bigote de los sueldos brutos mensuales de ambas ingenierías
boxplot(ingenierias$`Sueldo bruto mensual`, col="blue") * Histograma de frecuencias absolutas de los sueldos brutos mensuales de ambas ingenierías
hist(ingenierias$`Sueldo bruto mensual`, col="blue")- Varianza
var(ingenierias$`Sueldo bruto mensual`)## [1] 72042493
- Desviación estándar
sd(ingenierias$`Sueldo bruto mensual`)## [1] 8487.785
- Gráfico de dispersión
plot(ingenierias$`Sueldo bruto mensual`) ## Estimación de parámetros
¿Que carrera gana más dinero según estos datos?
Para contestar esto haremos un análisis de prueba de hipótesis
Grafico comparativo de conjuntos de datos de los sueldos brutos mensaules de mecatrónica y electromecánica
boxplot(ingenierias$`Sueldo bruto mensual` ~ ingenierias$Perfil, col="blue")¿Que grado académico está percibiendo más sueldo?
boxplot(ingenierias$`Sueldo bruto mensual` ~ ingenierias$`Grado mínimo`, col="blue") ¿Que estado de la repúblicaestá percibiendo más sueldo?
boxplot(ingenierias$`Sueldo bruto mensual` ~ ingenierias$Estado, col="blue")¿Qué es lo que hace que ciertos estados se pague más que en otros?
- Existe una correlación entre sueldo bruto mensual de las ofertas laborales de los estados y su Producto interno bruto?
Análisis gráfico
plot(ingenierias$PIBEstado, ingenierias$`Sueldo bruto mensual`)Análisis de correlación
cor(ingenierias$PIBEstado, ingenierias$`Sueldo bruto mensual`)## [1] -0.1529404
TAREA
Con este índice de correlación y dado el análisi gráfico, NO vale la pena realizar un análisis de regresión lineal, entonces, si el PIB NO se relaciona con los sueldos, que si lo hace? ¿Son los estado con más población los que pagan mejor? -Construir modelo de regresión lineal usando los datos poblacionales
Análisis de probabilidades
para un ingeniero electromecánico o mecatrónico en México, que probabilidades existen de que ganes más de 15,000 pesos de sueldo bruto mensual?
Para esto usaremos la distribución normal, pero primero hay que conocer si efectivamente los datos son normales
- Para esto usaremos la prueba de normalidad de shapiro-wilk
shapiro.test(ingenierias$`Sueldo bruto mensual`)##
## Shapiro-Wilk normality test
##
## data: ingenierias$`Sueldo bruto mensual`
## W = 0.8547, p-value = 0.0001405
Los datos no se comportan de manera normal
Ahora realizaremos un primer análisis paramétrico para conocer los resultados que obtendríamos de usar la distribución normal
Promedio: 1058347 Desviación estándar: 8487.785
¿Cual es la probabilidad puntual de que un ingeniero gane 15,000 pesos al mes?
dnorm(15000, mean =1058347, sd= 8487.785)## [1] 0
Este resultado es dado que los datos NO son normales
Tarea
- Existe una correlación entre sueldo bruto mensual de las ofertas laborales de los estados y la poblacion del estado?
Analisis Grafico
plot(ingenierias$`Sueldo bruto mensual`, ingenierias$`Poblacion por estado`)Análisis de correlación
Acontinuacion se muestra el analisis de correlacion del sueldo bruto mensual con respecto ala poblacion de cada estado del pais.
cor(ingenierias$`Poblacion por estado`, ingenierias$`Sueldo bruto mensual`)## [1] -0.2201248