setwd("~/pye1pm")
library(readxl)
carreras<- read_excel("datosproy1.xlsx")library(pacman)
p_load("prettydoc", "xfun", "fdth", "modeest", "beanplot", "datasets", "DT", "ggplot2", "readr")La ingeniería industrial es una profesión de ingeniería que se ocupa de la optimización de procesos, sistemas u organizaciones complejos mediante el desarrollo, la mejora y la implementación de sistemas integrados de personas, riqueza, conocimiento, información y equipamiento, energía, materiales y procesos.
La administración de empresas es un método y práctica organizacional basado en la gestión de sociedades mercantiles con el objetivo de llevarlas a su mayor optimización posible.
Objetivo
El objetivo de este presente estudio es conocer de una manera descriptiva y cuantitativa como es la oferta laboral económica para las carreras de ingenieria industrial y administraciòn de empresas. Este conjunto de datos los recaudamos por medio de internet, de paginas donde empresas solicitan empleados de dichas carreras como las uqe se hablaran que son ingenieria industrial y administración de empresas.
Datos con los que se trabajarán, se muestran en una tabla interactiva
datatable(carreras)Como se puede observar contamos con 40 empleos diferentes, en los cuales son de 20 de ingenieria industrial y 20 de licenciatura en administracion, a continuacion vamos a comparar los datos.
A continuacion se mostraran las siguientes ciudades en las que se solicitan empleos
tablaciud <- table(carreras$Ciudad)
tablaciud##
## Alvaro Obregon Apodaca Atizapan Zaragoza
## 2 1 1
## Benito Juarez Cd Hidalgo Cd Obregon
## 1 1 2
## CDMX Cuajimalpa de Morelos Culiacan
## 1 1 1
## Guadalajara Guadalupe Guanajuato
## 2 1 1
## Hermosillo Huamantla Iztalapa
## 1 1 1
## Iztapalapa La paz Mazatlan
## 1 1 1
## Mérida Miguel Hidalgo Nogales
## 1 1 1
## Puebla Queretaro San Luis Potosi
## 3 1 1
## San Pedro Siltepec Sin especificar
## 1 1 1
## Tepic Tizayuca Tlalnepantla
## 1 1 1
## Valladolid Zapopan Zaragoza
## 1 3 1
Con los datos presentados nos podemos dar cuenta que la mayor recoleccion de empleos se encuentra al sur de mexico, encabezado por el DF y zapopan.
Análisis exploratorio de los datos
summary(carreras)## Puesto Perfil Sueldo Estado
## Length:40 Length:40 Min. : 7000 Length:40
## Class :character Class :character 1st Qu.: 9000 Class :character
## Mode :character Mode :character Median :11000 Mode :character
## Mean :14823
## 3rd Qu.:14625
## Max. :85000
## Ciudad Pais Especialidad Grado minimo
## Length:40 Length:40 Length:40 Length:40
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## Fuente PIBEstado POBEstado
## Length:40 Min. : 91005 Min. :1235456
## Class :character 1st Qu.: 369370 1st Qu.:2944840
## Mode :character Median : 551755 Median :6183860
## Mean :1174710 Mean :5897912
## 3rd Qu.:1656113 3rd Qu.:8563599
## Max. :2848734 Max. :9209944
Grafico de caja y bigote de los diferentes sueldos de ambas carreras
boxplot(carreras$Sueldo, col="red")Aqui se puede observar como es que los sueldos se concentran los 10,000, los sueldos que salen de 0, son trabajos en los que no se especifica la cantidad. Tambien es importante observar como es que el grafico aisla los sueldos que son mayores a 25,000, poniendo que estos son raros de hallar un trabajo con ese sueldo.
Histograma de frecuencias absolutas de los sueldos brutos mensuales de ambas carreras
hist(carreras$Sueldo, col="red")Varianza
var(carreras$Sueldo)## [1] 176179957
Desviación estándar
sd(carreras$Sueldo)## [1] 13273.28
##Grafico de dispersion en los sueldos de ambas carreras
plot(carreras$Sueldo, col="red")Estimación de parámetros
¿Qué carrera se puede observar que gana más dinero?
Para saber la respuesta es necesario hacer una prueba de hipótesis Realizando un grafico comparativo del conjunto de datos de los sueldos de ambas carreras
boxplot(carreras$Sueldo ~ carreras$Perfil, col="red")¿Que grado académico está percibiendo más sueldo?
boxplot(carreras$Sueldo ~ carreras$`Grado minimo`, col="red")Existe una correlación entre sueldo bruto mensual de las ofertas laborales de los estados y su Producto interno bruto?
Análisis gráfico
plot(carreras$PIBEstado, carreras$Sueldo, col="red")Análisis de correlación
cor(carreras$PIBEstado, carreras$Sueldo)## [1] 0.07394323
Relación de los sueldos con el número de profesionales ocupados por estado
##{r} ##plot(carreras$profesionistas, carreras$Sueldo) ##
Análisis de probabilidades
Si eres un ingeniero industrial o uno de administración de empresas en México, que probabilidades existen de que ganes más de 20,000 pesos de sueldo bruto mensual?
Para esto usaremos la distribución normal, pero primero hay que conocer si efectivamente los datos son normales
Para esto usaremos la prueba de normalidad de shapiro-wilk
shapiro.test(carreras$Sueldo)##
## Shapiro-Wilk normality test
##
## data: carreras$Sueldo
## W = 0.51384, p-value = 2.482e-10
Los datos no se comportan de manera normal
Ahora realizaremos un primer análisis paramétrico para conocer los resultados que obtendríamos de usar la distribución normal
Promedio:1174710 Desviación estandar:13273.28
¿Cual es la probabilidad puntual de que un ingeniero gane 15,000 pesos al mes?
dnorm(20000, mean = 1174710, sd= 13273.28 )## [1] 0
Esto resultado es 0, ya que los datos no son normales
Ahora usaremos la distribución Poisson
Cola izquierda
1-ppois(19999, lambda = 40)## [1] 0