En el presente análisis estaremos estudiando una de las principales preocupaciones de las instituciones de educación superior está asociada los problemas del proceso de elección y cambio de carrera teniendo como población base la facultad de ingeniería. la recolección se realizó aplicando encuestas a los alumnos de las diferentes carreras ingeniería en la universidad nacional autónoma de honduras. Este estudio es de gran importancia para poder ayudar a los alumnos que no tienen muy claras sus aptitudes académicas y así mejorar la toma de decisiones.
| variable | classe | values |
|---|---|---|
| Marca.temporal | character | 2020/04/07 4:49:53 p. m. GMT-5, 2020/04/07 5:15:30 p. m. GMT-5, 2020/04/08 8:04:40 p. m. GMT-5, 2020/04/09 11:22:32 a. m. GMT-5, 2020/04/11 2:56:00 p. m. GMT-5, 2020/04/14 3:25:32 p. m. GMT-5 |
| Â.CuÃ.l.es.tu.rango.de.edad. | character | 21-24 años, 21-24 años, 21-24 años, 21-24 años, 21-24 años, mayor de 28 |
| En.Tegucigalpa.vives.en.casa.de. | character | Padres, Padres, Padres, Familiares, Propia, Propia |
| Â.CuÃ.l.es.tu.lugar.de.origen. | character | Francisco Morazán, Choluteca, Francisco Morazán, Comayagua, Francisco Morazán, Francisco Morazán |
| Â.Trabajas. | character | Si, No, Si, No, Si, Si |
| Â.CuÃ.l.es.tu.rango.de.ingreso.mensual. | character | 0 - 3000 L., Mayor a 6000 L., Mayor a 6000 L., 0 - 3000 L., 3000- 6000 L., Mayor a 6000 L. |
| Â.Tienes.familiares.que.ya.se.graduaron.de.la.universidad. | character | Si, Si, Si, Si, Si, Si |
| Â.Tienes.familiares.que.estudiaron.la.misma.carrera. | character | No, No, No, No, Si, Si |
| Â.Investigaste.acerca.del.plan.de.estudios.de.la.carrera.que.estÃ.s.estudiando. | character | Si, Si, No, Si, Si, Si |
| Â.Por.cuÃ.l.de.los.siguientes.medios.recibiste.ayuda.por.parte.de.la.universidad.para.elegir.tu.carrera. | character | Ninguna, Ninguna, Ninguna, Ninguna, Ferias Vocacionales, Ninguna |
| Â.Conoces.las.diferentes.areas.de.trabajo.de.la.carrera.estas.cursando. | character | Si, Si, Si, Si, Si, Si |
| Â.Has.realizado.anteriormente.un.test.vocacional.. | character | Si, Si, No, No, Si, No |
| Â.Dónde.has.realizado.el.los.test.vocacional.les. | character | Colegio;Internet, Internet, , , Colegio, |
| Â.En.quÃ..momento.has.realizado.el.test. | character | Antes de cursar la carrera, Durante la carrera, , , Antes de cursar la carrera, |
| Â.Los.resultados.del.test.realizado.fueron.acorde.a.la.carrera.cursada.actualmente. | character | No, Si, , , Si, |
| Â.Sabes.de.la.existencia.de.los.test.vocacionales.que.se.realizan.en.UNAH. | character | No, Si, No, Si, Si, No |
| Â.CuÃ.les.han.sido.las.razones.de.elegir.la.carrera.actual. | character | Influencia familiar, Interés general en el area de conocimiento, Demanda laboral, Interés general en el area de conocimiento;Demanda laboral;Beneficios económicos, Interés general en el area de conocimiento;Demanda laboral;Beneficios económicos, Interés general en el area de conocimiento;Demanda laboral;Beneficios económicos |
| Â.CuÃ.lÂ..es.el.grado.de.satisfacción.con.la.carrera.cursada.actualmente. | character | Poco satisfecho, Muy satisfecho, Poco satisfecho, Poco satisfecho, Muy satisfecho, Muy satisfecho |
| Â.CuÃ.l.es.el.grado.de.satisfacción.en.cuanto.a.los.docentes.de.tu.facultad.de.ingenierÃ.a. | character | Poco satisfecho, Nada satisfecho, Poco satisfecho, Poco satisfecho, Muy satisfecho, Poco satisfecho |
| Â.QuÃ..tan.motivado.te.sientes.respecto.a.tu.carrera. | integer | 3, 5, 1, 4, 5, 5 |
| Â.EstÃ.s.estudiando.la.carrera.que.inicialmente.optaste.por.estudiar. | character | Si, Si, Si, Si, Si, Si |
| Â.Has.realizado.un.cambio.de.carrera. | character | No, SÃ, No, No, No, No |
| Â.Estarias.interesado.en.que.el.departamento.de.la.Facultad.Ingenieria.te.proporcionara.una.herramienta.en.linea.para.recibir.una.orientación.vocacionalÂ.. | character | Si, Si, Si, Si, Si, Si |
| Â.Has.pensado.en.realizar.un.cambio.de.carrera. | character | SÃ, , SÃ, SÃ, Tal vez, No |
| Â.QuÃ..factores.ha.intervenido.para.no.realizar.el.cambio.de.carrera. | character | Recursos y tiempo invertidos en la carrera, , El sistema de cambio de carrera no te lo permite, Recursos y tiempo invertidos en la carrera;Opinion familiar/amigos, Recursos y tiempo invertidos en la carrera, |
| Â.CuÃ.ntas.veces.has.realizado.un.cambio.de.carrera. | integer | NA, 1, NA, NA, NA, NA |
| Â.CuÃ.les.fueron.los.factores.que.influenciaron.a.realizar.el.cambio. | character | , Falta de puntos para la carrera a la cual aplico en la PAA, , , , |
| X.Â.La.carrera.que.querias.estudiar.esta.dentro.de.la.oferta.acadÃ.mica.de.UNAH. | logical | NA, NA, NA, NA, NA, NA |
| Â.QuÃ..carrera.estÃ.s.estudiando. | character | IngenierÃa en Sistemas, IngenierÃa QuÃmica, IngenierÃa Eléctrica, IngenierÃa QuÃmica, IngenierÃa Civil, IngenierÃa en Sistemas |
| Â.Estudias.mÃ.s.de.una.carrera..Â.CuÃ.l. | character | , , , , , No |
| Â.Te.hubiera.gustado.estudiar.otra.carrera.Â.CuÃ.l. | character | Gastronomia, , Si, , Mercadotecnia, No |
| Â.QuÃ..aÃ.o.llevas.segun.tu.plan.de.estudios. | integer | 4, 3, 3, 2, 2, 2 |
| Â.QuÃ..porcentaje.de.clases.llevas.cursadas. | character | mas de 50%, mas de 50%, mas de 50%, 0-20%, 0-20%, 20-50% |
| Â.QuÃ..porcentaje.de.las.clases.cursadas.son.de.la.facultad.de.IngenierÃ.a. | character | 50-70%, 30-50%, 0-30%, 0-30%, 30-50%, 0-30% |
| Â.QuÃ..porcentaje.de.las.clases.cursadas.son.de.la.facultad.de.MatemÃ.ticas. | character | 0-30%, 30-50%, 50-70%, 30-50%, 50-70%, 0-30% |
| Â.En.quÃ..rango.se.encuentra.tu.indice.acadÃ.mico. | character | 80-89, 70-79, 65-69, <65, 70-79, <65 |
| Â.Has.reprobado.alguna.clase. | character | Si, Si, Si, Si, Si, Si |
| Â.De.quÃ..aÃ.o.eran.la.las.clases. | integer | 2, 1, 2, 1, 1, 1 |
| Â.Has.reprobado.una.o.mas.veces.una.clase.de.facultad.de.ingenierÃ.a. | character | Si, Si, Si, Si, No, Si |
| Â.Que.jornada.acadÃ.mica.tienes.este.periodo. | character | Mañana;Tarde, Mañana;Tarde, Tarde;Noche, Mañana, Mañana, Noche |
| Â.Te.gusta.estudiar.en.grupo. | character | Tal vez, Si, Si, No, Si, No |
| Â.En.promedio.cuÃ.ntas.horas.estudias.al.dia. | character | 2-4 horas, mas de 4 horas, 0-2 horas, 0-2 horas, 0-2 horas, 0-2 horas |
| Â.Cómo.identificas.tus.habilidades.en.cuanto.a.las..siguientes.caracterÃ.sticas…Comunicación.oral.y.escrita. | character | Alta, Alta, Muy alta, Muy alta, Alta, Muy alta |
| Â.Cómo.identificas.tus.habilidades.en.cuanto.a.las..siguientes.caracterÃ.sticas…Relaciones.interpersonales. | character | Media, Alta, Muy alta, Alta, Alta, Muy alta |
| Â.Cómo.identificas.tus.habilidades.en.cuanto.a.las..siguientes.caracterÃ.sticas…Creatividad. | character | Alta, Alta, Media, Muy alta, Alta, Muy alta |
| Â.Cómo.identificas.tus.habilidades.en.cuanto.a.las..siguientes.caracterÃ.sticas…Liderazgo. | character | Alta, Muy alta, Alta, Media, Alta, Muy alta |
| Â.Cómo.identificas.tus.habilidades.en.cuanto.a.las..siguientes.caracterÃ.sticas…Autodidacta. | character | Media, Alta, Media, Media, Alta, Muy alta |
| Â.Con.cúal.de.las.siguientes.areas.te.sientes.mÃ.s.identificado…CÃ.lculo.mental. | character | Medio, Muy alto, Medio, Medio, Alto, Alto |
| Â.Con.cúal.de.las.siguientes.areas.te.sientes.mÃ.s.identificado…Resolución.de.puzzles.o.rompecabezas. | character | Alto, , Muy alto, Alto, Muy alto, Muy alto |
| Â.Con.cúal.de.las.siguientes.areas.te.sientes.mÃ.s.identificado…Juegos.de.estrategia. | character | Alto, Muy alto, Alto, Alto, Alto, Muy alto |
| Â.Con.cúal.de.las.siguientes.areas.te.sientes.mÃ.s.identificado…Manejo.numÃ.rico.y.operaciones.matemÃ.tica. | character | Medio, Alto, Medio, Medio, Medio, Alto |
| X | character | Si, No, Si, Si, No, |
Una vez realizado un primer análisis de toda la información, decidimos eliminar las siguientes variables: - Timestamp: Dado que no nos interesa saber el tiempo en que fue llenada la información optamos por eliminar esta variable de nuestro conjunto de datos. - nombre_opcion_carrera: Considerando que esta variable existe en respuesta a la pregunta ¿Le hubiera gustado estudiar otra carrera?, redunda un poco en relación a las variable de pensado_cambio_carrera, y se determino eliminar dado que también no era una variable que aportara mucho valor, dado que generaba mucha categorización por ser una variable de una pregunta muy abierta.
Para hacer mas legible la lectura de las variables se renombraron y quedaron como sigue:
| variable | classe | values |
|---|---|---|
| Timestamp | character | 2020/04/07 4:49:53 p.m. GMT-5, 2020/04/07 5:15:30 p.m. GMT-5, 2020/04/08 8:04:40 p.m. GMT-5, 2020/04/09 11:22:32 a.m. GMT-5, 2020/04/11 2:56:00 p.m. GMT-5, 2020/04/14 3:25:32 p.m. GMT-5 |
| edad | character | 21-24 años, 21-24 años, 21-24 años, 21-24 años, 21-24 años, mayor de 28 |
| lugar_residencia | character | Padres, Padres, Padres, Familiares, Propia, Propia |
| lugar_origen | character | Francisco Morazán, Choluteca, Francisco Morazán, Comayagua, Francisco Morazán, Francisco Morazán |
| trabaja | character | Si, No, Si, No, Si, Si |
| ingreso_mensual | character | 0 - 3000 L., Mayor a 6000 L., Mayor a 6000 L., 0 - 3000 L., 3000- 6000 L., Mayor a 6000 L. |
| familiares_graduados | character | Si, Si, Si, Si, Si, Si |
| familiares_misma_carrera | character | No, No, No, No, Si, Si |
| conocimiento_plan_estudios | character | Si, Si, No, Si, Si, Si |
| asesoria_universitaria | character | Ninguna, Ninguna, Ninguna, Ninguna, Ferias Vocacionales, Ninguna |
| conocimiento_areas_carrera | character | Si, Si, Si, Si, Si, Si |
| previo_test_vocacional | character | Si, Si, No, No, Si, No |
| lugar_test_vocacional | character | Colegio;Internet, Internet, , , Colegio, |
| momento_test_vocacional | character | Antes de cursar la carrera, Durante la carrera, , , Antes de cursar la carrera, |
| resultados_congruentes_test | character | No, Si, , , Si, |
| conocimiento_test_unah | character | No, Si, No, Si, Si, No |
| razones_eleccion_carrera | character | Influencia familiar, Interés general en el area de conocimiento, Demanda laboral, Interés general en el area de conocimiento;Demanda laboral;Beneficios económicos, Interés general en el area de conocimiento;Demanda laboral;Beneficios económicos, Interés general en el area de conocimiento;Demanda laboral;Beneficios económicos |
| satisfaccion_carrera | character | Poco satisfecho, Muy satisfecho, Poco satisfecho, Poco satisfecho, Muy satisfecho, Muy satisfecho |
| satisfaccion_docentes | character | Poco satisfecho, Nada satisfecho, Poco satisfecho, Poco satisfecho, Muy satisfecho, Poco satisfecho |
| motivacion | integer | 3, 5, 1, 4, 5, 5 |
| opcion_inicial_carrera | character | Si, Si, Si, Si, Si, Si |
| cambio_carrera | character | No, Sí, No, No, No, No |
| interes_herramienta_tecnologica | character | Si, Si, Si, Si, Si, Si |
| pensado_cambio_carrera | character | Sí, , Sí, Sí, Tal vez, No |
| factores_no_cambio | character | Recursos y tiempo invertidos en la carrera, , El sistema de cambio de carrera no te lo permite, Recursos y tiempo invertidos en la carrera;Opinion familiar/amigos, Recursos y tiempo invertidos en la carrera, |
| veces._cambio_carrera | integer | NA, 1, NA, NA, NA, NA |
| factores_cambio_carrera | character | , Falta de puntos para la carrera a la cual aplico en la PAA, , , , |
| nombre_carrera | character | Ingeniería en Sistemas, Ingeniería Química, Ingeniería Eléctrica, Ingeniería Química, Ingeniería Civil, Ingeniería en Sistemas |
| multiple_carrera | character | , , , , , No |
| nombre_opcion_carrera | character | Gastronomia, , Si, , Mercadotecnia, No |
| año_carrera | integer | 4, 3, 3, 2, 2, 2 |
| procentaje_clases_cursadas | character | mas de 50%, mas de 50%, mas de 50%, 0-20%, 0-20%, 20-50% |
| porcentaje_clases_facultad | character | 50-70%, 30-50%, 0-30%, 0-30%, 30-50%, 0-30% |
| porcentaje_clases_matematica | character | 0-30%, 30-50%, 50-70%, 30-50%, 50-70%, 0-30% |
| indice_academico | character | 80-89, 70-79, 65-69, <65, 70-79, <65 |
| reprobado | character | Si, Si, Si, Si, Si, Si |
| año_reprobacion | integer | 2, 1, 2, 1, 1, 1 |
| reprobado_mas_de_dos | character | Si, Si, Si, Si, No, Si |
| jornada | character | Mañana;Tarde, Mañana;Tarde, Tarde;Noche, Mañana, Mañana, Noche |
| estudia_grupo | character | Tal vez, Si, Si, No, Si, No |
| horas_estudio_diario | character | 2-4 horas, mas de 4 horas, 0-2 horas, 0-2 horas, 0-2 horas, 0-2 horas |
| comunicación_oral_escrita. | character | Alta, Alta, Muy alta, Muy alta, Alta, Muy alta |
| relaciones_interpersonales. | character | Media, Alta, Muy alta, Alta, Alta, Muy alta |
| creatividad | character | Alta, Alta, Media, Muy alta, Alta, Muy alta |
| liderazgo | character | Alta, Muy alta, Alta, Media, Alta, Muy alta |
| autodidacta | character | Media, Alta, Media, Media, Alta, Muy alta |
| calculo_mental | character | Medio, Muy alto, Medio, Medio, Alto, Alto |
| resolucion_puzzles | character | Alto, , Muy alto, Alto, Muy alto, Muy alto |
| juegos_estrategia | character | Alto, Muy alto, Alto, Alto, Alto, Muy alto |
| operaciones_matematicas | character | Medio, Alto, Medio, Medio, Medio, Alto |
Como se puede observar se capturaron 198 observaciones y 50 columnas en funcion a las siguentes categorias.
En el caso de la variable pensado_cambio_carrera se encontraron 4 niveles mostrados a continuacion.
##
## No Sí Tal vez
## 0.3535354 0.3181818 0.1868687 0.1414141
Una vez realizado el análisis a la variable pensado_cambio_carrera identificamos valores vacíos, y dado que el valor “Si” y el valor “Tal vez” llevaban a la misma pregunta posteriormente se optó por imputarla a un Si, teniendo con esto una variable de tres niveles con valores vacíos, y procedimos a asignar los valores vacíos a las categorías con mas respuestas, siendo el caso la categoría “Si”.
##
## No Sí
## 63 135
Para la variable factor_cambio_carrera se obtienen los resultados siguuentes, Donde podemos ver un resumen de las frecuencia para cada una de las categorías creadas para esta variable, cabe mencionar que dada la combinación de respuestas se genera la cantidad de categorías.
| Var1 | Freq |
|---|---|
| 0.6464646 | |
| Falta de puntos para la carrera a la cual aplico en la PAA | 0.0959596 |
| Cambio de intereses personales | 0.0505051 |
| No era lo que esperaba | 0.0404040 |
| Cambio de intereses personales;Falta de puntos para la carrera a la cual aplico en la PAA | 0.0202020 |
| Cambio de intereses personales;No era lo que esperaba | 0.0202020 |
| Cambio de intereses personales;Factor económico;No era lo que esperaba | 0.0151515 |
| Factor económico | 0.0151515 |
| Factor económico;Falta de puntos para la carrera a la cual aplico en la PAA | 0.0101010 |
| Influencia familiar;Cambio de intereses personales;Factor económico;No era lo que esperaba | 0.0101010 |
| No era lo que esperaba;Falta de puntos para la carrera a la cual aplico en la PAA | 0.0101010 |
| No era lo que esperaba;Rendimiento académico | 0.0101010 |
| Cambio de intereses personales;Factor económico | 0.0050505 |
| Cambio de intereses personales;Factor económico;No era lo que esperaba;Rendimiento académico | 0.0050505 |
| Cambio de intereses personales;No era lo que esperaba;Falta de puntos para la carrera a la cual aplico en la PAA | 0.0050505 |
| Cambio de intereses personales;No era lo que esperaba;Rendimiento académico | 0.0050505 |
| Factor económico;No era lo que esperaba | 0.0050505 |
| Influencia familiar | 0.0050505 |
| Influencia familiar;Cambio de intereses personales;No era lo que esperaba | 0.0050505 |
| Influencia familiar;Falta de puntos para la carrera a la cual aplico en la PAA | 0.0050505 |
| Influencia familiar;No era lo que esperaba | 0.0050505 |
| Influencia familiar;No era lo que esperaba;Falta de puntos para la carrera a la cual aplico en la PAA | 0.0050505 |
| Rendimiento académico | 0.0050505 |
analizando estas frencuencias en un boxplot, es evidente la cantidad de valores atípicos dada la dispersión de los datos, de igual manera podemos observar en el histograma la distancia entre frecuencias y en el QQ-Plot que no sigue una línea.
Dadas las observaciones se procedió a realizar una recategorización de los factores por los que las personas no realizan un cambio de carrera, reduciéndolo a 6 categorías para una mejor distribución de la información quedando detallada.
| Var1 | Freq |
|---|---|
| Cambio de intereses personales | 0.3636364 |
| Influencia familiar | 0.2727273 |
| Factor económico | 0.1818182 |
| No era lo que esperaba | 0.1363636 |
| Falta de puntos en la PAA | 0.0454545 |
### Histograma de factor_cambio_carrera
Como se puede observar después del tratamiento de todas las categorías, hay una mejor distribución entre las categorías de los factores
Para la variable multiple_carrera se obtuvieron los resultados, en la cual se puede observar una gran cantidad de categorías, producto de las diferentes respuestas dadas por cada entrevistado, generando esto demasiada variación entre los datos.
| Var1 | Freq |
|---|---|
| 0.5404040 | |
| No | 0.3434343 |
| no | 0.0555556 |
| Diplomado de Inglés | 0.0050505 |
| Ingeniería de Sonido en línea | 0.0050505 |
| Matemática | 0.0050505 |
| Matematicas | 0.0050505 |
| Ninguna | 0.0050505 |
| NO | 0.0050505 |
| No | 0.0050505 |
| No. | 0.0050505 |
| Si | 0.0050505 |
| Sí, Letras | 0.0050505 |
| Solo una | 0.0050505 |
| Técnico en reded | 0.0050505 |
Podemos observar en la ilustración, donde se registra el boxplot, histograma y QQ-Plot. El tratamiento realizado para esta variable fue convertirla en una variable binaria Si/No, ya que dadas las variaciones consideramos de mayor importancia saber si un estudiante lleva una múltiple carrera a o no, este procedimiento se hizo tomando todas las variaciones de no e imputarlas a NO y todas las categorías que tienen una carrera a un SI.
| Var1 | Freq |
|---|---|
| Si | 0.5833333 |
| No | 0.4166667 |
Como se puede observar después del tratamiento de la columna, hay una mejor distribución qqnorm
Se opto por esta correlación para saber si el índice académico y los factores de cambio están dependientemente relacionadas.
##
## No Sí
## 1.0000000 0.0000000
## <65 0.6969697 0.3030303
## 65-69 0.6190476 0.3809524
## 70-79 0.6506024 0.3493976
## 80-89 0.5757576 0.4242424
## 90-100 0.8333333 0.1666667
Para comprobar o no si las dos variables eran independientes o no, se realizó la prueba de chi cuadrado y se formularon dos hipótesis: - H_0: Las categorías de índice académico y factores cambio son independientes. - H_A: Las categorías son dependientes.
El p-value obtenido mediante la prueba de chi cuadrado indica el siguiente resultado:
## Warning in chisq.test(table(survey$indice_academico, survey$cambio_carrera)):
## Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: table(survey$indice_academico, survey$cambio_carrera)
## X-squared = 2.6982, df = 5, p-value = 0.7464
Conclusión: Según nuestro p-value rechazamos nuestra hipotesis nula, por la tanto las variables son dependientes
Con esta correlación se quiere saber si el porcentaje de clases de facultad afecta en los factores de cambio de carrera. Se genero un grafico para el respectivo análisis y visualización.
##
## No Sí
## 0-30% 0.6336634 0.3663366
## 30-50% 0.5483871 0.4516129
## 50-70% 0.6666667 0.3333333
## mas de 70% 0.7500000 0.2500000
Para comprobar o no si las dos variables eran independientes o no, se realizó la prueba de chi cuadrado y se formularon dos hipótesis: - H_0: Las categorías de factores cambio y porcentaje clases facultad son independientes. - H_A: Las categorías son dependientes.
El p-value obtenido mediante la prueba de chi cuadrado indica el siguiente resultado:
##
## Pearson's Chi-squared test
##
## data: table(survey$porcentaje_clases_facultad, survey$cambio_carrera)
## X-squared = 3.1192, df = 3, p-value = 0.3736
Conclusión: Segun nuestro p-value rechazamos nuestra hipotesis nula, por la tanto las variables son dependientes
##
## No Sí
## 0.00781250 0.00000000
## <65 0.17968750 0.14285714
## 65-69 0.20312500 0.22857143
## 70-79 0.42187500 0.41428571
## 80-89 0.14843750 0.20000000
## 90-100 0.03906250 0.01428571
Aquí decidimos realizar una correlación con el índice académico vs el cambio de carrera que es nuestra variable dependiente. Se desea conocer si influye o no el índice académico para realizar un cambio de carrera.
## Warning in chisq.test(table(survey$indice_academico, survey$cambio_carrera)):
## Chi-squared approximation may be incorrect
##
## Pearson's Chi-squared test
##
## data: table(survey$indice_academico, survey$cambio_carrera)
## X-squared = 2.6982, df = 5, p-value = 0.7464
Conclusión: Según nuestro p-value rechazamos nuestra hipótesis nula, por lo tanto las variables son dependientes.
##
## No Sí
## 0 - 3000 L. 0.4531250 0.4285714
## 3000- 6000 L. 0.2109375 0.3142857
## Mayor a 6000 L. 0.3359375 0.2571429
Aquí decidimos realizar una correlación con los ingresos mensuales económicos vs el cambio de carrera, que es nuestra variable dependiente.
Se desea conocer si influye o no el ingreso económico para realizar un cambio de carrera. - H_O: Las categorías de Ingreso mensual y Cambio de carrera son independientes. - H_A: Las categorías son dependientes. Procedemos a analizar los resultados obtenidos y obtenemos el valor de nuestra p-value.
##
## Pearson's Chi-squared test
##
## data: table(survey$ingreso_mensual, survey$cambio_carrera)
## X-squared = 2.9264, df = 2, p-value = 0.2315
Conclusión: Según nuestro p-value rechazamos nuestra hipótesis nula, por lo tanto las variables son dependientes.
Basados en la información recolectada a través de las encuestas por los diferentes estudiantes que colaboraron con la investigación mediante sus testimonios, se propone la creación de una plataforma online, la cual es una herramienta que pretende brindar información detallada sobre los intereses de una persona y actividades profesionales que pueden encajar con ella.
Este tipo de herramientas seria de mucha ayuda a la universidad, tanto a los alumnos que están por ingresar, como los que ya pertenecen al campus. Hoy en día la universidad no cuenta con una forma de evaluar de manera efectiva y rápida, y ello conlleva a que el alumno elija una carrera sin tener ninguna orientación previa o realizar un cambio de la misma, incluso ya con algunas clases aprobadas y esto perjudica tanto a la universidad como al alumno en tiempo y dinero invertido para su educación.
La siguiente tabla lista los componentes que van a utilizarse para nuestra solución tecnológica y en el posterior diagrama la comunicación de los principales:
Diagrama
Nuestra solución tecnológica tiene como objetivo brindar a los estudiantes, docentes, decanos y al jefe de facultad una manera de mejorar la toma de decisiones. A los alumnos se les facilitará la opción de realizar un test vocacional en línea donde puedan obtener una respuesta que les ayude a mejorar su desenvolvimiento; y a los docentes, decanos y jefes de facultad una forma de visualizar, analizar y conocer a la población de los estudiantes obteniendo reportes de esas pruebas de aptitud y así mejorar la toma de decisiones ayudando a los alumnos y minimizando los costos que la universidad invierte en sus estudiantes en los recursos invertidos.
Los componentes necesarios para el funcionamiento de este portal se orientan hacia una solución en la nube y optamos por alojarlos en Microsoft Azure ya que la universidad tiene relaciones de diferentes servicios con ellos. En los diagrama anterior incluimos dos apps services, uno para el Front-end y otro para el API; el Front-end realiza llamados HTTP al API, el cual se encargará de retornar la información necesaria que viene desde la base de datos,0 de igual manera el front-end se encarga de enviar la información de un formulario de un test vocacional al backend el cual se almacenará en una base de datos no relacional. Dentro de nuestro aplicativo va a estar manejado por roles a los cuales los usuarios tendrán diferentes permisos todo eso se asignará en la base de datos relacional y gestionado tanto por el backend como el frontend para mostrarle a los usuarios a los módulos que ellos tienen acceso según el rol.
La comunicación de estos tres componentes es de vital importancia para para mantener el servicio de la aplicación y evitar que fallen estos que estarán a la disposición de los diferentes usuarios los cuales van a interactuar con el frontend. Dejando de nuestra parte un análisis y deseño de la aplicación que puedan ser utilies para los propios investigadores y también para otros profesionales de nuestra universidad.
Diagrama procesamiento informacion
Para el procesamiento de la información utilizaremos 3 componentes de azure los cuales detallo a continuación para enlazar los componentes databricks,ML Studio y Blob Storage utilizaremos lo que es data Factory que podemos configurar para que se ejecute en una hora específica y movilizar el contenido ya procesado a la base de datos para su análisis o visualización.
Utilizaremos databriks para el procesamiento ya que maneja lo que es el procesamiento de datos multiproceso y es muy rápido es una de las mejores alternativas hoy en día. para entrenar los modelos vamos a utilizar ml studio ya que contiene algoritmos de machine learning, Los cuales podemos parametrizar y entrenar para que generen las predicciones al estudiante hacia la carrera que tiene mejor vocación. Para el almacenamiento de reportes mayores a 15mb o modelos ya entrenados optamos por blobstorage de azure el cual es muy seguro y se maneja mediante roles para asignar sus respectivos permisos.
Service type Custom name Region Description Estimated monthly cost Estimated monthly cost
| Service type | Custom name | Region | Description | Estimated monthly cost | Estimated monthly cost |
|---|---|---|---|---|---|
| Data Factory | East US 2 | Tipo Azure Data Factory V2, tipo de servicio Data Pipeline, Azure Integration Runtime: 0 Ejecuciones de actividades, 0 unidades de movimiento de datos, 0 actividades de canalización, 0 actividades de canalización: externas; Integration Runtime autohospedado: 0 Ejecuciones de actividades, 0 unidades de movimiento de datos, 0 actividades de canalización, 0 actividades de canalización: externas, 0 x 8 núcleos virtuales optimizados para proceso, 0 x 8 núcleos virtuales de uso general, 0 x 8 núcleos virtuales optimizados para memoria, 1 operaciones de lectura/escritura, 1 operaciones de supervisión | $0.75 | $0.00 | |
| App Service Plan | East US | Nivel Básico; 1 B3 Plan de App Service para Linux Total de ACU: 400 7 GB de memoria Equivalente de proceso de serie A | $55.70 | $0.00 | |
| Storage Accounts | East US 2 | Redundancia Almacenamiento de blobs en bloque, Uso general V2 y LRS, Acceso frecuente Nivel de acceso, 1 x 1 PB, 1 x 100 TB de capacidad - 1 año de reserva, 100.000 operaciones de escritura, 100.000 operaciones de lista y creación de contenedores, 100.000 operaciones de lectura, 100.000 operaciones de lectura de alta prioridad de Archive Storage, 1 operaciones de otro tipo. 100 TB de recuperación de datos, 100 TB de recuperación de alta prioridad de Archive Storage, 100 TB de escritura de datos | $128.75 | $0.00 | |
| App Service | East US | Nivel Básico; 1 B3 (1 núcleos, 1.75 GB de RAM, 10 GB de almacenamiento) x 730 Hours; SO Windows | $55.70 | $0.00 | |
| App Service | East US | Nivel Básico; 1 B3 (1 núcleos, 1.75 GB de RAM, 10 GB de almacenamiento) x 730 Hours; SO Windows | $55.70 | $0.00 | |
| Azure SQL Database | East US 2 | Base de datos única, modelo de compra Núcleo virtual, nivel Uso general Tier, Aprovisionado, Gen 5, 1, instancias 8 vCore, 1 año de reserva, 32 GB de almacenamiento, 0 GB de almacenamiento de copia de seguridad | $143.96 | $0.00 | |
| Azure Databricks | East US 2 | Carga de trabajo Análisis de datos, nivel Premium, 1 D3V2 (4 vCPU, 14 GB DE RAM) x 730 Hours, Pago por uso, 0.75 DBU x 730 Hours | $386.17 | $0.00 | |
| Machine Learning Studio | South Central US | Free | $0.00 | $0.00 |