Introducción

En el presente análisis estaremos estudiando una de las principales preocupaciones de las instituciones de educación superior está asociada los problemas del proceso de elección y cambio de carrera teniendo como población base la facultad de ingeniería. la recolección se realizó aplicando encuestas a los alumnos de las diferentes carreras ingeniería en la universidad nacional autónoma de honduras. Este estudio es de gran importancia para poder ayudar a los alumnos que no tienen muy claras sus aptitudes académicas y así mejorar la toma de decisiones.


Limpieza de la data

Variables capturadas encuesta

variable classe values
Marca.temporal character 2020/04/07 4:49:53 p. m. GMT-5, 2020/04/07 5:15:30 p. m. GMT-5, 2020/04/08 8:04:40 p. m. GMT-5, 2020/04/09 11:22:32 a. m. GMT-5, 2020/04/11 2:56:00 p. m. GMT-5, 2020/04/14 3:25:32 p. m. GMT-5
Â.CuÃ.l.es.tu.rango.de.edad. character 21-24 años, 21-24 años, 21-24 años, 21-24 años, 21-24 años, mayor de 28
En.Tegucigalpa.vives.en.casa.de. character Padres, Padres, Padres, Familiares, Propia, Propia
Â.CuÃ.l.es.tu.lugar.de.origen. character Francisco Morazán, Choluteca, Francisco Morazán, Comayagua, Francisco Morazán, Francisco Morazán
Â.Trabajas. character Si, No, Si, No, Si, Si
Â.CuÃ.l.es.tu.rango.de.ingreso.mensual. character 0 - 3000 L., Mayor a 6000 L., Mayor a 6000 L., 0 - 3000 L., 3000- 6000 L., Mayor a 6000 L.
Â.Tienes.familiares.que.ya.se.graduaron.de.la.universidad. character Si, Si, Si, Si, Si, Si
Â.Tienes.familiares.que.estudiaron.la.misma.carrera. character No, No, No, No, Si, Si
Â.Investigaste.acerca.del.plan.de.estudios.de.la.carrera.que.estÃ.s.estudiando. character Si, Si, No, Si, Si, Si
Â.Por.cuÃ.l.de.los.siguientes.medios.recibiste.ayuda.por.parte.de.la.universidad.para.elegir.tu.carrera. character Ninguna, Ninguna, Ninguna, Ninguna, Ferias Vocacionales, Ninguna
Â.Conoces.las.diferentes.areas.de.trabajo.de.la.carrera.estas.cursando. character Si, Si, Si, Si, Si, Si
Â.Has.realizado.anteriormente.un.test.vocacional.. character Si, Si, No, No, Si, No
Â.Dónde.has.realizado.el.los.test.vocacional.les. character Colegio;Internet, Internet, , , Colegio,
Â.En.quÃ..momento.has.realizado.el.test. character Antes de cursar la carrera, Durante la carrera, , , Antes de cursar la carrera,
Â.Los.resultados.del.test.realizado.fueron.acorde.a.la.carrera.cursada.actualmente. character No, Si, , , Si,
Â.Sabes.de.la.existencia.de.los.test.vocacionales.que.se.realizan.en.UNAH. character No, Si, No, Si, Si, No
Â.CuÃ.les.han.sido.las.razones.de.elegir.la.carrera.actual. character Influencia familiar, Interés general en el area de conocimiento, Demanda laboral, Interés general en el area de conocimiento;Demanda laboral;Beneficios económicos, Interés general en el area de conocimiento;Demanda laboral;Beneficios económicos, Interés general en el area de conocimiento;Demanda laboral;Beneficios económicos
Â.CuÃ.lÂ..es.el.grado.de.satisfacción.con.la.carrera.cursada.actualmente. character Poco satisfecho, Muy satisfecho, Poco satisfecho, Poco satisfecho, Muy satisfecho, Muy satisfecho
Â.CuÃ.l.es.el.grado.de.satisfacción.en.cuanto.a.los.docentes.de.tu.facultad.de.ingenierÃ.a. character Poco satisfecho, Nada satisfecho, Poco satisfecho, Poco satisfecho, Muy satisfecho, Poco satisfecho
Â.QuÃ..tan.motivado.te.sientes.respecto.a.tu.carrera. integer 3, 5, 1, 4, 5, 5
Â.EstÃ.s.estudiando.la.carrera.que.inicialmente.optaste.por.estudiar. character Si, Si, Si, Si, Si, Si
Â.Has.realizado.un.cambio.de.carrera. character No, Sí, No, No, No, No
Â.Estarias.interesado.en.que.el.departamento.de.la.Facultad.Ingenieria.te.proporcionara.una.herramienta.en.linea.para.recibir.una.orientación.vocacionalÂ.. character Si, Si, Si, Si, Si, Si
Â.Has.pensado.en.realizar.un.cambio.de.carrera. character Sí, , Sí, Sí, Tal vez, No
Â.QuÃ..factores.ha.intervenido.para.no.realizar.el.cambio.de.carrera. character Recursos y tiempo invertidos en la carrera, , El sistema de cambio de carrera no te lo permite, Recursos y tiempo invertidos en la carrera;Opinion familiar/amigos, Recursos y tiempo invertidos en la carrera,
Â.CuÃ.ntas.veces.has.realizado.un.cambio.de.carrera. integer NA, 1, NA, NA, NA, NA
Â.CuÃ.les.fueron.los.factores.que.influenciaron.a.realizar.el.cambio. character , Falta de puntos para la carrera a la cual aplico en la PAA, , , ,
X.Â.La.carrera.que.querias.estudiar.esta.dentro.de.la.oferta.acadÃ.mica.de.UNAH. logical NA, NA, NA, NA, NA, NA
Â.QuÃ..carrera.estÃ.s.estudiando. character Ingeniería en Sistemas, Ingeniería Química, Ingeniería Eléctrica, Ingeniería Química, Ingeniería Civil, Ingeniería en Sistemas
Â.Estudias.mÃ.s.de.una.carrera..Â.CuÃ.l. character , , , , , No
Â.Te.hubiera.gustado.estudiar.otra.carrera.Â.CuÃ.l. character Gastronomia, , Si, , Mercadotecnia, No
Â.QuÃ..aÃ.o.llevas.segun.tu.plan.de.estudios. integer 4, 3, 3, 2, 2, 2
Â.QuÃ..porcentaje.de.clases.llevas.cursadas. character mas de 50%, mas de 50%, mas de 50%, 0-20%, 0-20%, 20-50%
Â.QuÃ..porcentaje.de.las.clases.cursadas.son.de.la.facultad.de.IngenierÃ.a. character 50-70%, 30-50%, 0-30%, 0-30%, 30-50%, 0-30%
Â.QuÃ..porcentaje.de.las.clases.cursadas.son.de.la.facultad.de.MatemÃ.ticas. character 0-30%, 30-50%, 50-70%, 30-50%, 50-70%, 0-30%
Â.En.quÃ..rango.se.encuentra.tu.indice.acadÃ.mico. character 80-89, 70-79, 65-69, <65, 70-79, <65
Â.Has.reprobado.alguna.clase. character Si, Si, Si, Si, Si, Si
Â.De.quÃ..aÃ.o.eran.la.las.clases. integer 2, 1, 2, 1, 1, 1
Â.Has.reprobado.una.o.mas.veces.una.clase.de.facultad.de.ingenierÃ.a. character Si, Si, Si, Si, No, Si
Â.Que.jornada.acadÃ.mica.tienes.este.periodo. character Mañana;Tarde, Mañana;Tarde, Tarde;Noche, Mañana, Mañana, Noche
Â.Te.gusta.estudiar.en.grupo. character Tal vez, Si, Si, No, Si, No
Â.En.promedio.cuÃ.ntas.horas.estudias.al.dia. character 2-4 horas, mas de 4 horas, 0-2 horas, 0-2 horas, 0-2 horas, 0-2 horas
Â.Cómo.identificas.tus.habilidades.en.cuanto.a.las..siguientes.caracterÃ.sticas…Comunicación.oral.y.escrita. character Alta, Alta, Muy alta, Muy alta, Alta, Muy alta
Â.Cómo.identificas.tus.habilidades.en.cuanto.a.las..siguientes.caracterÃ.sticas…Relaciones.interpersonales. character Media, Alta, Muy alta, Alta, Alta, Muy alta
Â.Cómo.identificas.tus.habilidades.en.cuanto.a.las..siguientes.caracterÃ.sticas…Creatividad. character Alta, Alta, Media, Muy alta, Alta, Muy alta
Â.Cómo.identificas.tus.habilidades.en.cuanto.a.las..siguientes.caracterÃ.sticas…Liderazgo. character Alta, Muy alta, Alta, Media, Alta, Muy alta
Â.Cómo.identificas.tus.habilidades.en.cuanto.a.las..siguientes.caracterÃ.sticas…Autodidacta. character Media, Alta, Media, Media, Alta, Muy alta
Â.Con.cúal.de.las.siguientes.areas.te.sientes.mÃ.s.identificado…CÃ.lculo.mental. character Medio, Muy alto, Medio, Medio, Alto, Alto
Â.Con.cúal.de.las.siguientes.areas.te.sientes.mÃ.s.identificado…Resolución.de.puzzles.o.rompecabezas. character Alto, , Muy alto, Alto, Muy alto, Muy alto
Â.Con.cúal.de.las.siguientes.areas.te.sientes.mÃ.s.identificado…Juegos.de.estrategia. character Alto, Muy alto, Alto, Alto, Alto, Muy alto
Â.Con.cúal.de.las.siguientes.areas.te.sientes.mÃ.s.identificado…Manejo.numÃ.rico.y.operaciones.matemÃ.tica. character Medio, Alto, Medio, Medio, Medio, Alto
X character Si, No, Si, Si, No,

Una vez realizado un primer análisis de toda la información, decidimos eliminar las siguientes variables: - Timestamp: Dado que no nos interesa saber el tiempo en que fue llenada la información optamos por eliminar esta variable de nuestro conjunto de datos. - nombre_opcion_carrera: Considerando que esta variable existe en respuesta a la pregunta ¿Le hubiera gustado estudiar otra carrera?, redunda un poco en relación a las variable de pensado_cambio_carrera, y se determino eliminar dado que también no era una variable que aportara mucho valor, dado que generaba mucha categorización por ser una variable de una pregunta muy abierta.

Para hacer mas legible la lectura de las variables se renombraron y quedaron como sigue:

Variables capturadas renombradas

variable classe values
Timestamp character 2020/04/07 4:49:53 p.m. GMT-5, 2020/04/07 5:15:30 p.m. GMT-5, 2020/04/08 8:04:40 p.m. GMT-5, 2020/04/09 11:22:32 a.m. GMT-5, 2020/04/11 2:56:00 p.m. GMT-5, 2020/04/14 3:25:32 p.m. GMT-5
edad character 21-24 años, 21-24 años, 21-24 años, 21-24 años, 21-24 años, mayor de 28
lugar_residencia character Padres, Padres, Padres, Familiares, Propia, Propia
lugar_origen character Francisco Morazán, Choluteca, Francisco Morazán, Comayagua, Francisco Morazán, Francisco Morazán
trabaja character Si, No, Si, No, Si, Si
ingreso_mensual character 0 - 3000 L., Mayor a 6000 L., Mayor a 6000 L., 0 - 3000 L., 3000- 6000 L., Mayor a 6000 L.
familiares_graduados character Si, Si, Si, Si, Si, Si
familiares_misma_carrera character No, No, No, No, Si, Si
conocimiento_plan_estudios character Si, Si, No, Si, Si, Si
asesoria_universitaria character Ninguna, Ninguna, Ninguna, Ninguna, Ferias Vocacionales, Ninguna
conocimiento_areas_carrera character Si, Si, Si, Si, Si, Si
previo_test_vocacional character Si, Si, No, No, Si, No
lugar_test_vocacional character Colegio;Internet, Internet, , , Colegio,
momento_test_vocacional character Antes de cursar la carrera, Durante la carrera, , , Antes de cursar la carrera,
resultados_congruentes_test character No, Si, , , Si,
conocimiento_test_unah character No, Si, No, Si, Si, No
razones_eleccion_carrera character Influencia familiar, Interés general en el area de conocimiento, Demanda laboral, Interés general en el area de conocimiento;Demanda laboral;Beneficios económicos, Interés general en el area de conocimiento;Demanda laboral;Beneficios económicos, Interés general en el area de conocimiento;Demanda laboral;Beneficios económicos
satisfaccion_carrera character Poco satisfecho, Muy satisfecho, Poco satisfecho, Poco satisfecho, Muy satisfecho, Muy satisfecho
satisfaccion_docentes character Poco satisfecho, Nada satisfecho, Poco satisfecho, Poco satisfecho, Muy satisfecho, Poco satisfecho
motivacion integer 3, 5, 1, 4, 5, 5
opcion_inicial_carrera character Si, Si, Si, Si, Si, Si
cambio_carrera character No, Sí, No, No, No, No
interes_herramienta_tecnologica character Si, Si, Si, Si, Si, Si
pensado_cambio_carrera character Sí, , Sí, Sí, Tal vez, No
factores_no_cambio character Recursos y tiempo invertidos en la carrera, , El sistema de cambio de carrera no te lo permite, Recursos y tiempo invertidos en la carrera;Opinion familiar/amigos, Recursos y tiempo invertidos en la carrera,
veces._cambio_carrera integer NA, 1, NA, NA, NA, NA
factores_cambio_carrera character , Falta de puntos para la carrera a la cual aplico en la PAA, , , ,
nombre_carrera character Ingeniería en Sistemas, Ingeniería Química, Ingeniería Eléctrica, Ingeniería Química, Ingeniería Civil, Ingeniería en Sistemas
multiple_carrera character , , , , , No
nombre_opcion_carrera character Gastronomia, , Si, , Mercadotecnia, No
año_carrera integer 4, 3, 3, 2, 2, 2
procentaje_clases_cursadas character mas de 50%, mas de 50%, mas de 50%, 0-20%, 0-20%, 20-50%
porcentaje_clases_facultad character 50-70%, 30-50%, 0-30%, 0-30%, 30-50%, 0-30%
porcentaje_clases_matematica character 0-30%, 30-50%, 50-70%, 30-50%, 50-70%, 0-30%
indice_academico character 80-89, 70-79, 65-69, <65, 70-79, <65
reprobado character Si, Si, Si, Si, Si, Si
año_reprobacion integer 2, 1, 2, 1, 1, 1
reprobado_mas_de_dos character Si, Si, Si, Si, No, Si
jornada character Mañana;Tarde, Mañana;Tarde, Tarde;Noche, Mañana, Mañana, Noche
estudia_grupo character Tal vez, Si, Si, No, Si, No
horas_estudio_diario character 2-4 horas, mas de 4 horas, 0-2 horas, 0-2 horas, 0-2 horas, 0-2 horas
comunicación_oral_escrita. character Alta, Alta, Muy alta, Muy alta, Alta, Muy alta
relaciones_interpersonales. character Media, Alta, Muy alta, Alta, Alta, Muy alta
creatividad character Alta, Alta, Media, Muy alta, Alta, Muy alta
liderazgo character Alta, Muy alta, Alta, Media, Alta, Muy alta
autodidacta character Media, Alta, Media, Media, Alta, Muy alta
calculo_mental character Medio, Muy alto, Medio, Medio, Alto, Alto
resolucion_puzzles character Alto, , Muy alto, Alto, Muy alto, Muy alto
juegos_estrategia character Alto, Muy alto, Alto, Alto, Alto, Muy alto
operaciones_matematicas character Medio, Alto, Medio, Medio, Medio, Alto

Como se puede observar se capturaron 198 observaciones y 50 columnas en funcion a las siguentes categorias.


Demografica

  • edad
  • Lugar_origen
  • Lugar_residencia
  • Trabaja
  • ingreso_mensual

Familiar

  • familiares_graduados
  • familiares_misma_carrera
  • ocupacion_madre
  • ocupacion_padre

Registro

  • nombre_carrera
  • multiple_carrera
  • nombre_segunda_carrera
  • otras_opciones_estudio
  • nombre_opcion_carrera
  • ano_carrera
  • indice_academico
  • clases_cursadas

Matricula

  • clases_matriculadas
  • porcentaje_clases_facultad
  • porcentaje_clases_Matematica
  • reprobado
  • reprobado_mas_de_dos
  • clases_reprobadas_mas_de_dos

Orientacion

  • Asistencia_feria_vocacional
  • conocimiento_plan_estudios
  • orientacion_curso_introductorio
  • asesoria_universitaria
  • actividades_profesion
  • conocimiento_test_vocacional_unah
  • previo_test_vocacional
  • lugar_test_vovacional
  • tiempo_test_vocacional
  • resultados_congruentes_test

Oferta Academica

  • razones_eleccion_carrera
  • satisfaccion_carrera
  • satisfaccion_docentes
  • factor_satisfaccion
  • inseguridad_continuar_carrera
  • motivacion
  • opcion_inicial_carrera
  • oferta_academica_carrera
  • cambio_carrera
  • factores_cambio_carrera
  • pensado_realizar_cambio
  • factores_no_cambio
  • interes_herramienta_tecnologica

Habitos del estudiante

  • jornada
  • estudia_grupo
  • horas_estudio_diario

Soft Skills

  • trabajo en equipo
  • capacidad de comunicación oral y escrita
  • relaciones interpersonales
  • creatividad
  • liderazgo
  • autodidacta

Imputaciones realizadas

En el caso de la variable pensado_cambio_carrera se encontraron 4 niveles mostrados a continuacion.

## 
##                  No        Sí   Tal vez 
## 0.3535354 0.3181818 0.1868687 0.1414141

Una vez realizado el análisis a la variable pensado_cambio_carrera identificamos valores vacíos, y dado que el valor “Si” y el valor “Tal vez” llevaban a la misma pregunta posteriormente se optó por imputarla a un Si, teniendo con esto una variable de tres niveles con valores vacíos, y procedimos a asignar los valores vacíos a las categorías con mas respuestas, siendo el caso la categoría “Si”.

## 
##  No  Sí 
##  63 135

Análisis descriptivo

Analisando variable factor_cambio_carrera

Para la variable factor_cambio_carrera se obtienen los resultados siguuentes, Donde podemos ver un resumen de las frecuencia para cada una de las categorías creadas para esta variable, cabe mencionar que dada la combinación de respuestas se genera la cantidad de categorías.

Var1 Freq
0.6464646
Falta de puntos para la carrera a la cual aplico en la PAA 0.0959596
Cambio de intereses personales 0.0505051
No era lo que esperaba 0.0404040
Cambio de intereses personales;Falta de puntos para la carrera a la cual aplico en la PAA 0.0202020
Cambio de intereses personales;No era lo que esperaba 0.0202020
Cambio de intereses personales;Factor económico;No era lo que esperaba 0.0151515
Factor económico 0.0151515
Factor económico;Falta de puntos para la carrera a la cual aplico en la PAA 0.0101010
Influencia familiar;Cambio de intereses personales;Factor económico;No era lo que esperaba 0.0101010
No era lo que esperaba;Falta de puntos para la carrera a la cual aplico en la PAA 0.0101010
No era lo que esperaba;Rendimiento académico 0.0101010
Cambio de intereses personales;Factor económico 0.0050505
Cambio de intereses personales;Factor económico;No era lo que esperaba;Rendimiento académico 0.0050505
Cambio de intereses personales;No era lo que esperaba;Falta de puntos para la carrera a la cual aplico en la PAA 0.0050505
Cambio de intereses personales;No era lo que esperaba;Rendimiento académico 0.0050505
Factor económico;No era lo que esperaba 0.0050505
Influencia familiar 0.0050505
Influencia familiar;Cambio de intereses personales;No era lo que esperaba 0.0050505
Influencia familiar;Falta de puntos para la carrera a la cual aplico en la PAA 0.0050505
Influencia familiar;No era lo que esperaba 0.0050505
Influencia familiar;No era lo que esperaba;Falta de puntos para la carrera a la cual aplico en la PAA 0.0050505
Rendimiento académico 0.0050505

Analizando frecuencias variable factor_cambio_carrera

analizando estas frencuencias en un boxplot, es evidente la cantidad de valores atípicos dada la dispersión de los datos, de igual manera podemos observar en el histograma la distancia entre frecuencias y en el QQ-Plot que no sigue una línea.

boxplot de factor_cambio_carrera

Histograma de factor_cambio_carrera

qqnorm de factor_cambio_carrera

Dadas las observaciones se procedió a realizar una recategorización de los factores por los que las personas no realizan un cambio de carrera, reduciéndolo a 6 categorías para una mejor distribución de la información quedando detallada.

Var1 Freq
Cambio de intereses personales 0.3636364
Influencia familiar 0.2727273
Factor económico 0.1818182
No era lo que esperaba 0.1363636
Falta de puntos en la PAA 0.0454545

boxplot de factor_cambio_carrera

### Histograma de factor_cambio_carrera

qqnorm de factor_cambio_carrera

Como se puede observar después del tratamiento de todas las categorías, hay una mejor distribución entre las categorías de los factores

Analizando variable multiple_carrera

Para la variable multiple_carrera se obtuvieron los resultados, en la cual se puede observar una gran cantidad de categorías, producto de las diferentes respuestas dadas por cada entrevistado, generando esto demasiada variación entre los datos.

Var1 Freq
0.5404040
No 0.3434343
no 0.0555556
Diplomado de Inglés 0.0050505
Ingeniería de Sonido en línea 0.0050505
Matemática 0.0050505
Matematicas 0.0050505
Ninguna 0.0050505
NO 0.0050505
No 0.0050505
No. 0.0050505
Si 0.0050505
Sí, Letras 0.0050505
Solo una 0.0050505
Técnico en reded 0.0050505

Podemos observar en la ilustración, donde se registra el boxplot, histograma y QQ-Plot. El tratamiento realizado para esta variable fue convertirla en una variable binaria Si/No, ya que dadas las variaciones consideramos de mayor importancia saber si un estudiante lleva una múltiple carrera a o no, este procedimiento se hizo tomando todas las variaciones de no e imputarlas a NO y todas las categorías que tienen una carrera a un SI.

boxplot de multiple_carrera

Histograma de multiple_carrera

qqnorm de multiple_carrera

Tranformacion variable multiple carrera

Var1 Freq
Si 0.5833333
No 0.4166667

boxplot de multiple_carrera

Histograma de multiple_carrera

qqnorm de multiple_carrera

Como se puede observar después del tratamiento de la columna, hay una mejor distribución qqnorm

Análisis correlacional

factores_cambio y índice académico

Se opto por esta correlación para saber si el índice académico y los factores de cambio están dependientemente relacionadas.

Tabla proporciones variables indice_academico,cambio_carrera

##         
##                 No        Sí
##          1.0000000 0.0000000
##   <65    0.6969697 0.3030303
##   65-69  0.6190476 0.3809524
##   70-79  0.6506024 0.3493976
##   80-89  0.5757576 0.4242424
##   90-100 0.8333333 0.1666667

Graficos de la relaciónes de la correlación

Para comprobar o no si las dos variables eran independientes o no, se realizó la prueba de chi cuadrado y se formularon dos hipótesis: - H_0: Las categorías de índice académico y factores cambio son independientes. - H_A: Las categorías son dependientes.

El p-value obtenido mediante la prueba de chi cuadrado indica el siguiente resultado:

## Warning in chisq.test(table(survey$indice_academico, survey$cambio_carrera)):
## Chi-squared approximation may be incorrect
## 
##  Pearson's Chi-squared test
## 
## data:  table(survey$indice_academico, survey$cambio_carrera)
## X-squared = 2.6982, df = 5, p-value = 0.7464

Conclusión: Según nuestro p-value rechazamos nuestra hipotesis nula, por la tanto las variables son dependientes

factores_cambio y porcentaje_clases_facultad

Con esta correlación se quiere saber si el porcentaje de clases de facultad afecta en los factores de cambio de carrera. Se genero un grafico para el respectivo análisis y visualización.

Tabla proporciones variables factores_cambio,porcentaje_clases_facultad

##             
##                     No        Sí
##   0-30%      0.6336634 0.3663366
##   30-50%     0.5483871 0.4516129
##   50-70%     0.6666667 0.3333333
##   mas de 70% 0.7500000 0.2500000

Graficos de la relaciónes de la correlación

Para comprobar o no si las dos variables eran independientes o no, se realizó la prueba de chi cuadrado y se formularon dos hipótesis: - H_0: Las categorías de factores cambio y porcentaje clases facultad son independientes. - H_A: Las categorías son dependientes.

El p-value obtenido mediante la prueba de chi cuadrado indica el siguiente resultado:

## 
##  Pearson's Chi-squared test
## 
## data:  table(survey$porcentaje_clases_facultad, survey$cambio_carrera)
## X-squared = 3.1192, df = 3, p-value = 0.3736

Conclusión: Segun nuestro p-value rechazamos nuestra hipotesis nula, por la tanto las variables son dependientes

Correlaciones con la variable dependiente

Cambio de carrera e índice de reprobación de clases

##         
##                  No         Sí
##          0.00781250 0.00000000
##   <65    0.17968750 0.14285714
##   65-69  0.20312500 0.22857143
##   70-79  0.42187500 0.41428571
##   80-89  0.14843750 0.20000000
##   90-100 0.03906250 0.01428571

Aquí decidimos realizar una correlación con el índice académico vs el cambio de carrera que es nuestra variable dependiente. Se desea conocer si influye o no el índice académico para realizar un cambio de carrera.

  • H_O: Las categorías de Índice académico y Cambio de carrera son independientes.
  • H_A: Las categorías son dependientes.
  • Procedemos a analizar los resultados obtenidos y obtenemos el valor de nuestra p-value.
## Warning in chisq.test(table(survey$indice_academico, survey$cambio_carrera)):
## Chi-squared approximation may be incorrect
## 
##  Pearson's Chi-squared test
## 
## data:  table(survey$indice_academico, survey$cambio_carrera)
## X-squared = 2.6982, df = 5, p-value = 0.7464

Conclusión: Según nuestro p-value rechazamos nuestra hipótesis nula, por lo tanto las variables son dependientes.

Cambio de carrera e Ingresos económicos

##                  
##                          No        Sí
##   0 - 3000 L.     0.4531250 0.4285714
##   3000- 6000 L.   0.2109375 0.3142857
##   Mayor a 6000 L. 0.3359375 0.2571429

Aquí decidimos realizar una correlación con los ingresos mensuales económicos vs el cambio de carrera, que es nuestra variable dependiente.

Se desea conocer si influye o no el ingreso económico para realizar un cambio de carrera. - H_O: Las categorías de Ingreso mensual y Cambio de carrera son independientes. - H_A: Las categorías son dependientes. Procedemos a analizar los resultados obtenidos y obtenemos el valor de nuestra p-value.

## 
##  Pearson's Chi-squared test
## 
## data:  table(survey$ingreso_mensual, survey$cambio_carrera)
## X-squared = 2.9264, df = 2, p-value = 0.2315

Conclusión: Según nuestro p-value rechazamos nuestra hipótesis nula, por lo tanto las variables son dependientes.

Solucion de TI

Plataforma online de intereses vocacionales

Basados en la información recolectada a través de las encuestas por los diferentes estudiantes que colaboraron con la investigación mediante sus testimonios, se propone la creación de una plataforma online, la cual es una herramienta que pretende brindar información detallada sobre los intereses de una persona y actividades profesionales que pueden encajar con ella.

Este tipo de herramientas seria de mucha ayuda a la universidad, tanto a los alumnos que están por ingresar, como los que ya pertenecen al campus. Hoy en día la universidad no cuenta con una forma de evaluar de manera efectiva y rápida, y ello conlleva a que el alumno elija una carrera sin tener ninguna orientación previa o realizar un cambio de la misma, incluso ya con algunas clases aprobadas y esto perjudica tanto a la universidad como al alumno en tiempo y dinero invertido para su educación.

Componentes

La siguiente tabla lista los componentes que van a utilizarse para nuestra solución tecnológica y en el posterior diagrama la comunicación de los principales:

Componente Tipo descripción

  • App Service Plan: Necesitamos nuestro App Service Plan donde correrán las WebApp
  • Webapp: front App service / WebApp (Frontend)
  • Webapp: Backend App Service/ API-Backend
  • Azure sql database: Base datos sql almacenamiento data transformada. 0
  • non relational database: Base de datos donde se guardan los documentos de cada encuesta de los alumnos.
  • Azure Databricks: Para procesar la información.
  • Azure Datafactory: Manejo flujo de la información y distribuirlo en sus distintos componentes.
  • Azure blob storage: Almacenamiento de los modelos
  • Azure ML: Entrenar modelos predictivos

Diagrama comunicación de principales componentes:

Diagrama

Diagrama

Nuestra solución tecnológica tiene como objetivo brindar a los estudiantes, docentes, decanos y al jefe de facultad una manera de mejorar la toma de decisiones. A los alumnos se les facilitará la opción de realizar un test vocacional en línea donde puedan obtener una respuesta que les ayude a mejorar su desenvolvimiento; y a los docentes, decanos y jefes de facultad una forma de visualizar, analizar y conocer a la población de los estudiantes obteniendo reportes de esas pruebas de aptitud y así mejorar la toma de decisiones ayudando a los alumnos y minimizando los costos que la universidad invierte en sus estudiantes en los recursos invertidos.

Los componentes necesarios para el funcionamiento de este portal se orientan hacia una solución en la nube y optamos por alojarlos en Microsoft Azure ya que la universidad tiene relaciones de diferentes servicios con ellos. En los diagrama anterior incluimos dos apps services, uno para el Front-end y otro para el API; el Front-end realiza llamados HTTP al API, el cual se encargará de retornar la información necesaria que viene desde la base de datos,0 de igual manera el front-end se encarga de enviar la información de un formulario de un test vocacional al backend el cual se almacenará en una base de datos no relacional. Dentro de nuestro aplicativo va a estar manejado por roles a los cuales los usuarios tendrán diferentes permisos todo eso se asignará en la base de datos relacional y gestionado tanto por el backend como el frontend para mostrarle a los usuarios a los módulos que ellos tienen acceso según el rol.

La comunicación de estos tres componentes es de vital importancia para para mantener el servicio de la aplicación y evitar que fallen estos que estarán a la disposición de los diferentes usuarios los cuales van a interactuar con el frontend. Dejando de nuestra parte un análisis y deseño de la aplicación que puedan ser utilies para los propios investigadores y también para otros profesionales de nuestra universidad.

Diagrama comunicación componentes para el procesamiento de la información.

Diagrama procesamiento informacion

Diagrama procesamiento informacion

Para el procesamiento de la información utilizaremos 3 componentes de azure los cuales detallo a continuación para enlazar los componentes databricks,ML Studio y Blob Storage utilizaremos lo que es data Factory que podemos configurar para que se ejecute en una hora específica y movilizar el contenido ya procesado a la base de datos para su análisis o visualización.

Utilizaremos databriks para el procesamiento ya que maneja lo que es el procesamiento de datos multiproceso y es muy rápido es una de las mejores alternativas hoy en día. para entrenar los modelos vamos a utilizar ml studio ya que contiene algoritmos de machine learning, Los cuales podemos parametrizar y entrenar para que generen las predicciones al estudiante hacia la carrera que tiene mejor vocación. Para el almacenamiento de reportes mayores a 15mb o modelos ya entrenados optamos por blobstorage de azure el cual es muy seguro y se maneja mediante roles para asignar sus respectivos permisos.

Presupuesto

Service type Custom name Region Description Estimated monthly cost Estimated monthly cost

Service type Custom name Region Description Estimated monthly cost Estimated monthly cost
Data Factory East US 2 Tipo Azure Data Factory V2, tipo de servicio Data Pipeline, Azure Integration Runtime: 0 Ejecuciones de actividades, 0 unidades de movimiento de datos, 0 actividades de canalización, 0 actividades de canalización: externas; Integration Runtime autohospedado: 0 Ejecuciones de actividades, 0 unidades de movimiento de datos, 0 actividades de canalización, 0 actividades de canalización: externas, 0 x 8 núcleos virtuales optimizados para proceso, 0 x 8 núcleos virtuales de uso general, 0 x 8 núcleos virtuales optimizados para memoria, 1 operaciones de lectura/escritura, 1 operaciones de supervisión $0.75 $0.00
App Service Plan East US Nivel Básico; 1 B3 Plan de App Service para Linux Total de ACU: 400 7 GB de memoria Equivalente de proceso de serie A $55.70 $0.00
Storage Accounts East US 2 Redundancia Almacenamiento de blobs en bloque, Uso general V2 y LRS, Acceso frecuente Nivel de acceso, 1 x 1 PB, 1 x 100 TB de capacidad - 1 año de reserva, 100.000 operaciones de escritura, 100.000 operaciones de lista y creación de contenedores, 100.000 operaciones de lectura, 100.000 operaciones de lectura de alta prioridad de Archive Storage, 1 operaciones de otro tipo. 100 TB de recuperación de datos, 100 TB de recuperación de alta prioridad de Archive Storage, 100 TB de escritura de datos $128.75 $0.00
App Service East US Nivel Básico; 1 B3 (1 núcleos, 1.75 GB de RAM, 10 GB de almacenamiento) x 730 Hours; SO Windows $55.70 $0.00
App Service East US Nivel Básico; 1 B3 (1 núcleos, 1.75 GB de RAM, 10 GB de almacenamiento) x 730 Hours; SO Windows $55.70 $0.00
Azure SQL Database East US 2 Base de datos única, modelo de compra Núcleo virtual, nivel Uso general Tier, Aprovisionado, Gen 5, 1, instancias 8 vCore, 1 año de reserva, 32 GB de almacenamiento, 0 GB de almacenamiento de copia de seguridad $143.96 $0.00
Azure Databricks East US 2 Carga de trabajo Análisis de datos, nivel Premium, 1 D3V2 (4 vCPU, 14 GB DE RAM) x 730 Hours, Pago por uso, 0.75 DBU x 730 Hours $386.17 $0.00
Machine Learning Studio South Central US Free $0.00 $0.00