El Análisis del Campo Laboral también implicó una Encuesta a empleadores para retroalimentar el mejoramiento del programa educativo de la Licenciatura en Estadística. El propósito fue identificar las posibles necesidades y problemáticas actuales y futuras del mercado laboral a nivel local, estatal, regional y nacional que atiende y atenderá el egresado de la Licenciatura en Ciencias y Técnicas Estadísticas (LCTE) y de la Licenciatura en Estadística. La metodología de trabajo fue la siguiente:
Como primer paso se instalaron y cargaron todas las librerias que son necesarias para poder realizar las nubes de palabras correspondientes, estas son las siguientes:
#install.packages("pacman")
library(pacman)
#install.packages("tidyverse")
library(tidyverse)
#install.packages("tm")
library(tm)
#install.packages("pdftools")
library(pdftools)
#install.packages("SnowballC")
library(SnowballC)
#install.packages("wordcloud2")
library(wordcloud2)
A continuación ocupamos la función “p_load” que ayuda a cargar uno o más paquetes. Esta función es un contenedor para ‘library’ y ‘require’. Verifica si un paquete está instalado, si no, intenta instalar el paquete desde CRAN y/o cualquier otro repositorio en la lista de repositorios de pacman.
p_load("tm")
p_load("tidyverse")
p_load("wordcloud")
p_load("RColorBrewer")
Para la eleboración de las nubes de palabras se ocuparan 4 bases de datos, debido a que se realizará una nube de palabras para cada sector con el que se cuenta (público/ privado), dos nubes serán sobre el nombre de la empresa y las otras dos respecto al giro con el que cuentan.
La primera nube corresponde a los nombres de las empresas del sector privado. Lo primero que se realiza es mandar a traer la base de datos como se muestra a continuación:
texto <- pdf_text("C:\\Users\\corte\\OneDrive\\Documentos\\8-SEMESTRE\\MINERIA\\pp1.pdf")
Después de haber cargado la base de datos se elabora el CORPUS y se guarda en otra variable:
docs <- Corpus(VectorSource(texto))
inspect(docs)
## <<SimpleCorpus>>
## Metadata: corpus specific: 1, document level (indexed): 0
## Content: documents: 1
##
## [1] Bellota Mexico.\n\nLibertad servicios financieros\n\nAgo Consultores\n\nKonfio\n\nMota-Engil\n\nCoppel\n\nCapgemini\n\nPODER HUMANO PRESTADORA DE SERVICIOS- S.A DE C.V\n\nTirex Michelin\n\nNEORIS S.A. de C.V.\n\nMapfre\n\nTotal play\n\nCaja popular teocelo s.c. de a.p. de r.l. de c.v.\n\nSuper Sacks\n\nDeportes Güicho\n\nGRUPO INDUSTRIAL TURBOWASH\n\nMobility ADO\n
El próximo paso a seguir es limpiar las palabras que contiene nuestra base de datos como se muestra en las siguientes lineas de código:
#Caracteres especiales de la codificación
toSpace <- content_transformer(function (x , pattern ) gsub(pattern, " ", x))
docs <- tm_map(docs, toSpace, "\r\n")
docs <- tm_map(docs, toSpace, "/")
docs <- tm_map(docs, toSpace, "@")
docs <- tm_map(docs, toSpace, "\\|")
# Quitar los números
docs <- tm_map(docs, removeNumbers)
# Quitar las palabras comunes en español
docs <- tm_map(docs, removeWords, stopwords("spanish"))
# Quitar palabras communes que consideres bajo tu criterio especificando un vector de palabras comunes a ser eliminadas
docs <- tm_map(docs, removeWords, c("palabrascomunes1", "palabrascomunes2", "palabrascomunes3", "elijan", "empezaran", "dice", "diciendo", "pues", "tambien", "hace", "asi", "traves"))
# Quitar signos de puntuación
docs <- tm_map(docs, removePunctuation)
# Eliminar espacios en blanco
docs <- tm_map(docs, stripWhitespace)
Por último antes de realizar la nube de palabras se crea una matriz de documentos con las siguientes lineas de código:
mtd <- TermDocumentMatrix(docs)
m <- as.matrix(mtd)
v <- sort(rowSums(m),decreasing=TRUE)
d <- data.frame(word = names(v),freq=v)
Por último se realiza la nube de palabras correspondiente al nombre de las empresas que son del sector privado.
wordcloud2(data = d, size = 0.5, shape = "pentagon", color="random-dark", ellipticity = 0.5)
Para las siguientes 3 nubes de palabras se repiten los pasos anteriores, por lo cual solo se mostraran las nubes y ya no todas las lineas de código correspondientes.
La segunda nube corresponde a los nombres de las empresas del sector público. La cual se muestra a continuació:
## <<SimpleCorpus>>
## Metadata: corpus specific: 1, document level (indexed): 0
## Content: documents: 1
##
## [1] NV 228 132 2693\n\nDirección de Educación Tecnológica\n\nFiscalia Especial en Personas Desaparecidas\n\nInstituto de Investigaciones Jurídicas\n\nOficina de Programa de Gobierno (PROGOB)\n\nCongreso del Estado\n\nComisión municipal de Agua potable drenaje y Alcantarillado de Banderilla\n\nFiscalía General del Estado de Veracruz de Ignacio de la Llave (FGE VERACRUZ)\n\nUniversidad Veracruzana\n\nUniversidad Veracruzana\n\nUniversidad Veracruzana\n\nFiscalía del Estado de Jalisco\n
La tercera nube corresponde al giro de las empresas del sector privado. La cual se muestra a continuación:
## <<SimpleCorpus>>
## Metadata: corpus specific: 1, document level (indexed): 0
## Content: documents: 1
##
## [1] fabricación y comercialización de herramientas y maquinaria\n\nServicios financieros\n\nasesoría y consultoría empresarial\n\nFintech\n\nconstrucción, infraestructuras y servicios de ingeniería civil\n\nproductos y servicios financieros, incluyendo ropa, calzado, electrodomésticos, productos\nelectrónicos, muebles y préstamos personales.\n\nconsultoría, tecnología y servicios digitales\n\nprestación de servicios de recursos humanos y consultoría empresarial.\n\nventa y distribución de llantas y servicios de mantenimiento\n\nconsultoría en tecnología de la información y servicios\n\nSeguros de autos\n\nTelecomunicaciones\n\nServicios financieros\n\nventa de artículos deportivos y ropa deportiva\n\nfabricación y venta de maquinaria y sistemas de limpieza industrial\n\nmovilidad personalizadas\n
La cuarta nube corresponde al giro de las empresas del sector público. La cual se muestra a continuación:
## <<SimpleCorpus>>
## Metadata: corpus specific: 1, document level (indexed): 0
## Content: documents: 1
##
## [1] Turismo\n\npromoción y el desarrollo de la educación en el estado\n\nGobierno\n\nGobierno\n\nGobierno\n\nGobierno\n\nGobierno\n\nGobierno\n\nDocente\n\nDocente\n\nDocente\n\nGobierno\n
UABC. (2020). Documento ejecutivo para la elaboración de la evaluación externa e interna para la modificación o actualización de planes de estudio de licenciatura de la UABC (Propuesta de instrumentos para estudios). Mexicali, Baja California. Coordinación General de Formación Profesional de la Universidad Autónoma de Baja California.
UV. (2005). Guía para el diseño de proyectos curriculares, con el enfoque de competencias. Xalapa, Veracruz, México. ISBN 968-834-705-1.