Carlos Rodríguez Contreras
22 de Enero de 2018
Situación Académico-Laboral
Investigación
Concluí el análisis de datos sobre la investigación educativa para mejorar la introducción del sistema de análisis estadístico Open Source R en la asignatura de Métodos Cuantitativos Aplicados a la Administración del Programa de Posgrado en Ciencias de la Administración de la UNAM, cuya hipótesis es:
La impartición estructurada de cátedra con el sistema de análisis estadístico R, que incluya una temprana exposición de sus ventajas, incrementará la asimilación de éste por parte de los alumnos de programas de MBA.
En un lapso de seis semestres (2014-1 - 2016-2) impartí alternadamente la mencionada asignatura, en unos semestres cubrí estrictamente el programa de la materia, en otros semestres, destiné las dos primeras sesiones a una inmersión a la Ciencia de Datos.
Con el propósito de medir la diferencia en el comportamiento de los alumnos en los dos estilos de impartición de la clase, suministré el Cuestionario de Estrategias Motivadas de Aprendizaje (Motivated Strategies for Learning Questionnaire - MSLQ).
El MSLQ es un instrumento de auto-informe diseñado para estimar las orientaciones motivacionales de los estudiantes universitarios y el uso de diferentes estrategias de aprendizaje en un curso universitario.
El MSLQ consta de una sección de motivación, y una sección de estrategias de aprendizaje. La sección de motivación consta de 31 ítems que evalúan las metas y creencias de valor que los estudiantes otorgan a un curso, sus creencias acerca de su habilidad para tener éxito en un curso, y su ansiedad respecto a los exámenes.
La sección de estrategias de aprendizaje incluye 31 ítems referentes a las diferentes estrategias cognitivas y metacognitivas de los alumnos. Además, la sección de estrategias de aprendizaje incluye 19 ítems relativos a la administración de diferentes recursos por parte de los alumnos.
Se concentraron los datos de los resultados en una base de datos consistente en un archivo .csv (comma separated values).
Cada uno de los 81 ítems se registró como una variable individual, y quedó agregado al resto de variables categóricas.
En total se suministraron 142 cuestionarios idénticos en el periodo de seis semestres.
Se hizo un análisis con la prueba estadística no paramétrica \( {\chi}^{2} \), que se ejecutó con una confiabilidad de 95% (significancia, o p-value de 0.05).
Se construyó una tabla de contingencia (X-tab) para cada uno de estos ítems. De esta manera, para cada ítem se trazó una hipótesis nula o hipótesis de no efecto y una hipótesis alterna, que implica el hallazgo de una diferencia estadísticamente significativa a un p-value de 0.05.
Lo más satisfactorio para mí en este curso es tratar de entender el contenido de la mejor manera posible
mlsq <- read.csv("MLSQ.csv", na.strings = "NA")
mlsq$R22 <- as.factor(mlsq$R22)
xtR22 <- xtabs(~ inmer + R22, data=mlsq)
dimnames(xtR22) = list("Inmersión"=c("No","Si"),"Respuestas"=c("4","5","6","7"))
chisq.test(xtR22)
Pearson's Chi-squared test
data: xtR22
X-squared = 97.126, df = 3, p-value < 2.2e-16
Presenté los resultados de esta investigación en el XXI Congreso Internacional de Investigación en Ciencias Administrativas, celebrado en Puerto Vallarta, Jalisco, México, los días 23 al 26 de mayo de 2017.
Dicté la respectiva ponencia en la mesa de Investigación Educativa.
Tuve una muy positiva retroalimentación.
Con la finalidad de hacer una eficiente minería de la web, utilizo el Proyecto GDELT, que concentra la producción mundial de contenido en Internet desde el 1o. de enero de 1997, actualizándose cada 15 minutos.
Me decidí por este proyecto ya que es incluso el utilizado por el sistema de Big Data de Google Google Cloud Platform, particularmente es el que se utiliza con el motor de búsqueda Google Big Query
Utilizo el Cluster IIMAS para ejecutar los programas para minar la base de datos GDELT.
En mi cuenta personal instalé el ecosistema anaconda para poder ejecutar los scripts de python para penetrar y extraer información de GDELT.
Ha sido necesaria la instalación de extensas librerías al sistema operativo de dicho Cluster (ubuntu server 14.04) para habilitarlo en la ejecución correcta de los scripts y en el almacenamiento de datos.
Los programas de cómputo se ejecutan durante días completos para completar las extracciones y búsquedas de datos.
Con esta capacidad me ha sido posible generar productos de datos como el estudio de las fuentes de información web sobre el virus Zika.
Docencia
En los semestres 2017-2 y 2018-1 impartí la asignatura de Métodos Cuantitativos Aplicados a la Administración, dentro del Programa de Posgrado en Ciencias de la Administración de la UNAM. Atendí a un promedio de 30 alumnos por semestre.
Administro varios sistemas de apoyo en línea para los alumnos, no sólo de este programa, sino de los programas a los que es invitado esporádicamente. Entre ellos se puede citar un sitio en RPubs que contiene los notebooks de las clases, y el sitio de facebook R@MBA-UNAM
Publicaciones
Continué enviando aportaciones para la sección fija BIG DATA, que trata el tema de Analítica de Negocios (Business Analytics).
Esta sección de la revista Emprendedores, editada por el Centro Nacional de Apoyo a la Pequeña y Mediana Empresa - CENAPYME, surgió a sugerencia que hice a los directivos para posicionar a esta revista como una de las primeras en el país que tratan este tema, que es la Ciencia de Datos llevada al ámbito de las ciencias administrativas.
Superación Académica
Durante 2017 asistí a los siguientes cursos del Programa de Actualización y Superación Docente (PASD) de la DGAPA, UNAM:
Con una duración de 40 horas. Impartido en el Centro de Salud Mental de la Facultad de Medicina, UNAM.
Con una duración de 40 horas. Impartido en la Coordinación de Ingeniería de Sistemas de la Facultad de Ingeniería, UNAM.
Programa 2018
Proyecto R@MBA-UNAM
Motivado por la retroalimentación obtenida durante el Congreso ACACIA de 2017, planeo efectuar una extensión del Proyecto R@MBA-UNAM que consistiría en una investigación cualitativa de seguimiento de exalumnos para conocer la utilidad de lo aprendido en la asignatura de Métodos Cuantitativos Aplicados a la Administración.
Para el análisis de los datos cualitativos, que se obtendrían a partir de entrevistas con exalumnos, planeo utilizar RQDA, extrensión de R que le otorga capacidades para análisis de texto. A la fecha es prácticamente desconocida en México esta opción de CAQDA.
Proyectos de Web Mining
Exploraré las librerías python, tales como numpy, scipy, pandas y matplotlib para hacer más eficiente el trabajo a lo largo de todo el pipeline OSEMN (Obtaining - Scrubbing - Exploring - Modeling - iNterpreting) que caracteriza a los proyectos de Ciencia de Datos.
Gracias a que se me ha aceptado la petición de instalar R y RStudio server en el Cluster IIMAS, explotaré este software y sus correspondientes librerías para el trabajo en Ciencia de Datos.
Impartiré la asignatura de Métodos Cuantitativos Aplicados a la Administración, dentro del Programa de Posgrado en Ciencias de la Administración de la UNAM, en los semestres 2018-2 y 2019-1, en la cual, atiendo a un promedio de 30 alumnos por semestre.
Exploraré la asistencia a un curso sobre Análisis Multivariado en las Ciencias Sociales.
Continuaré enviando aportaciones para la sección fija Big Data de la revista Emprendedores, mismas que seguirán bajo la tónica de diseminación de la Ciencia de Datos en el ámbito de los negocios.
Pretendo someter una ponencia con los avances de la extensión del proyecto R@MBA-UNAM al XXII Congreso Internacional de Investigación en Ciencias Administrativas, que se celebrará del 22 al 25 de mayo del presente año en Hermosillo, Sonora.
De no ser posible por las fechas límite, haré el intento en el Congreso Internacional de Ciencias Administrativas de la FCA-UNAM.