Este código corresponde al proyecto sobre las ventajas y desventajas de la eduacación a distáncia. Puede consultarse en el siguiente link: https://jeovannyymitzi.wixsite.com/educacionadistancia/post/educaci%C3%B3n-a-distancia
Cargar la base de datos
La base que se utilizo para este ejercicio, lo puedes consultar en el siguiente link.
## Warning: package 'readxl' was built under R version 4.1.3
cargar la paqueterias necesarias
library(readxl)
library(missMDA)
## Warning: package 'missMDA' was built under R version 4.1.3
library(FactoMineR)
## Warning: package 'FactoMineR' was built under R version 4.1.3
library(ggplot2)
Nombre de las variables de la base de datos.
names(registro)
## [1] "Sexo"
## [2] "Edad"
## [3] "¿Cuentas con acceso propio de internet en casa?"
## [4] "En general, ¿Cuentas con las herramientas necesarias para continuar de manera adecuada con las clases en lÃnea (computadora, internet propio, celular)?"
## [5] "¿Los dispositivos electrónicos son propios o debes compartirlos durante sus clases?"
## [6] "¿Cuentas con un espacio destinado para tomar las clases en lÃnea?"
## [7] "¿Te sientes satisfech@ con las aplicaciones/plataformas utilizadas para el aprendizaje a distancia?"
## [8] "¿Percibes que la comunicación es fluida entre estudiante-profesor?"
## [9] "¿Cuánto tiempo dedicas cada dÃa en promedio a su educación a distancia?"
## [10] "¿ConfÃas en que tu progreso académico es adecuado a través de la educación a distancia?"
## [11] "¿Disfrutas aprendiendo a distancia?"
## [12] "La falta de interacción con tus compañeros, ¿Consideras que fue una desventaja en elaprendizaje en lÃnea?"
## [13] "La falta de interacciónentre el alumno y el profesor ¿Consideras que fue una desventaja en el aprendizaje en linea?"
## [14] "El no contar con equipo de cómputo o tener problemas adversos (No tener internet, mala conexión, fallas en la luz) ¿Consideras que fue una desventaja en el aprendizaje en linea?"
## [15] "Permanecer la mayoria del tiempo en el dÃa encerrado, enfrente de una computadora o dispositivo móvil y no poder realizar actividades fÃsicas para distraerse, ¿Consideras que fue una desventaja en el aprendizaje en lÃnea?"
Se realizó un análisis de correspondencia para determinar si contar con un espacio destinado para tomar las clases en lÃnea tiene que ver con el tiempo que le dedica el estudiante en el dÃa a su educación a distancia y si disfruta o no el aprendizaje.
Convertir a factores las variables de interés.
Cuenta.Espacio.destinado.a.clases <- as.factor(registro$`¿Cuentas con un espacio destinado para tomar las clases en lÃnea?`)
Tiempo.de.estudio.al.dia <- as.factor(registro$`¿Cuánto tiempo dedicas cada dÃa en promedio a su educación a distancia?`)
Disfruta.el.aprendizaje <- as.factor(registro$`¿Disfrutas aprendiendo a distancia?`)
Realizar una nueva base de datos con las variables de interés
Base_nueva <- cbind.data.frame(Cuenta.Espacio.destinado.a.clases,Tiempo.de.estudio.al.dia,Disfruta.el.aprendizaje)
Base_nueva
## Cuenta.Espacio.destinado.a.clases Tiempo.de.estudio.al.dia
## 1 SÃ 5-7 horas
## 2 SÃ 5-7 horas
## 3 SÃ 3-5 horas
## 4 No 3-5 horas
## 5 SÃ 3-5 horas
## 6 SÃ 5-7 horas
## 7 No 7 horas o más
## 8 Sà 7 horas o más
## 9 No 5-7 horas
## 10 No 7 horas o más
## 11 Sà 7 horas o más
## 12 Sà 7 horas o más
## 13 SÃ 5-7 horas
## 14 SÃ 5-7 horas
## 15 SÃ 3-5 horas
## 16 No 7 horas o más
## 17 SÃ 5-7 horas
## 18 SÃ 3-5 horas
## 19 Sà 7 horas o más
## 20 No 3-5 horas
## 21 SÃ 3-5 horas
## 22 No 5-7 horas
## 23 SÃ 5-7 horas
## 24 SÃ 5-7 horas
## 25 No 5-7 horas
## 26 SÃ 5-7 horas
## 27 SÃ 3-5 horas
## 28 SÃ 5-7 horas
## 29 SÃ 3-5 horas
## 30 SÃ 3-5 horas
## 31 SÃ 3-5 horas
## 32 No 5-7 horas
## 33 SÃ 5-7 horas
## 34 No 5-7 horas
## Disfruta.el.aprendizaje
## 1 No
## 2 No
## 3 No
## 4 No
## 5 No
## 6 No
## 7 No
## 8 No
## 9 No
## 10 No
## 11 Si
## 12 Si
## 13 No
## 14 Si
## 15 No
## 16 No
## 17 Si
## 18 Si
## 19 No
## 20 No
## 21 No
## 22 Si
## 23 No
## 24 No
## 25 No
## 26 No
## 27 No
## 28 Si
## 29 Si
## 30 No
## 31 Si
## 32 Si
## 33 No
## 34 Si
Con la función MCA del paquete FactoMineR, realizar el análisis de correspondencia múltiple.
ACM = MCA(Base_nueva, graph = F)
summary(ACM)
##
## Call:
## MCA(X = Base_nueva, graph = F)
##
##
## Eigenvalues
## Dim.1 Dim.2 Dim.3 Dim.4
## Variance 0.399 0.368 0.303 0.264
## % of var. 29.896 27.578 22.724 19.802
## Cumulative % of var. 29.896 57.474 80.198 100.000
##
## Individuals (the 10 first)
## Dim.1 ctr cos2 Dim.2 ctr
## 1 | -0.179 0.236 0.047 | -0.164 0.216
## 2 | -0.179 0.236 0.047 | -0.164 0.216
## 3 | -0.769 4.360 0.594 | 0.607 2.948
## 4 | 0.129 0.122 0.010 | 0.688 3.791
## 5 | -0.769 4.360 0.594 | 0.607 2.948
## 6 | -0.179 0.236 0.047 | -0.164 0.216
## 7 | 1.258 11.675 0.705 | 0.772 4.766
## 8 | 0.361 0.960 0.082 | 0.691 3.815
## 9 | 0.719 3.810 0.387 | -0.083 0.055
## 10 | 1.258 11.675 0.705 | 0.772 4.766
## cos2 Dim.3 ctr cos2
## 1 0.040 | -0.592 3.402 0.521 |
## 2 0.040 | -0.592 3.402 0.521 |
## 3 0.370 | -0.038 0.014 0.001 |
## 4 0.286 | -0.278 0.752 0.047 |
## 5 0.370 | -0.038 0.014 0.001 |
## 6 0.040 | -0.592 3.402 0.521 |
## 7 0.265 | 0.259 0.650 0.030 |
## 8 0.301 | 0.499 2.418 0.157 |
## 9 0.005 | -0.832 6.724 0.519 |
## 10 0.265 | 0.259 0.650 0.030 |
##
## Categories
## Dim.1 ctr cos2 v.test Dim.2
## Cuenta.Espacio.destinado.a.clases_No | 1.200 35.393 0.600 4.448 | 0.104
## Cuenta.Espacio.destinado.a.clases_SÃ | -0.500 14.747 0.600 -4.448 | -0.044
## 3-5 horas | -0.966 25.263 0.447 -3.839 | 0.629
## 5-7 horas | 0.151 0.900 0.020 0.819 | -0.774
## 7 horas o más | 1.173 23.679 0.357 3.430 | 0.781
## Disfruta.el.aprendizaje_No | 0.010 0.006 0.000 0.084 | 0.519
## Disfruta.el.aprendizaje_Si | -0.021 0.012 0.000 -0.084 | -1.085
## ctr cos2 v.test Dim.3 ctr
## Cuenta.Espacio.destinado.a.clases_No 0.291 0.005 0.387 | -0.280 2.537
## Cuenta.Espacio.destinado.a.clases_SÃ 0.121 0.005 -0.387 | 0.117 1.057
## 3-5 horas 11.606 0.189 2.499 | 0.248 2.187
## 5-7 horas 25.567 0.533 -4.193 | -0.667 23.026
## 7 horas o más 11.384 0.158 2.284 | 1.135 29.170
## Disfruta.el.aprendizaje_No 16.510 0.563 4.310 | -0.427 13.595
## Disfruta.el.aprendizaje_Si 34.521 0.563 -4.310 | 0.894 28.426
## cos2 v.test
## Cuenta.Espacio.destinado.a.clases_No 0.033 -1.038 |
## Cuenta.Espacio.destinado.a.clases_SÃ 0.033 1.038 |
## 3-5 horas 0.029 0.985 |
## 5-7 horas 0.395 -3.612 |
## 7 horas o más 0.334 3.319 |
## Disfruta.el.aprendizaje_No 0.382 -3.550 |
## Disfruta.el.aprendizaje_Si 0.382 3.550 |
##
## Categorical variables (eta2)
## Dim.1 Dim.2 Dim.3
## Cuenta.Espacio.destinado.a.clases | 0.600 0.005 0.033 |
## Tiempo.de.estudio.al.dia | 0.596 0.536 0.494 |
## Disfruta.el.aprendizaje | 0.000 0.563 0.382 |
Base de datos extra para realizar la gráfica
cats = apply(Base_nueva, 2, function(x) nlevels(as.factor(x)))
mca.vars= data.frame(ACM$var$coord, Variable = rep(names(cats), cats))
mca.obs= data.frame(ACM$ind$coord)
Grafico
library(ggplot2)
ggplot(data = mca.obs, aes(x = Dim.1, y = Dim.2)) + geom_hline(yintercept = 0, colour = "gray70") + geom_vline(xintercept = 0, colour = "gray70") + geom_point(colour = "gray50", alpha = 0.7) + geom_density2d(colour = "gray80") + geom_text(data =mca.vars, aes(x = Dim.1, y = Dim.2, label = rownames(mca.vars), colour = Variable)) + ggtitle("ACM con las variables") + scale_colour_discrete(name = "Variable") +theme_minimal()
Resultado
knitr::include_graphics("MM.png")
Se puede observar que el componente 2 se muestra en el eje vertical. Los estudiantes poco satisfechos (2) con respecto con las aplicaciones o plataformas utilizadas para el aprendizaje a distancia de los estudiantes se encuentra lejos de las otras categorÃas en un lado del eje vertical. Por lo tanto, el componente 2 contrasta a los estudiantes poco satisfechos (2) con las otras categorÃas.
Se realizó un análisis de correspondencia para conocer si los hombres o las mujeres están satisfechos con la educación a distancia con respecto al tiempo que dedican a sus estudios.
convertir a factores las variables de interes
Sexo <- as.factor(registro$Sexo)
Satisfaccion <- as.factor(registro$`¿Te sientes satisfech@ con las aplicaciones/plataformas utilizadas para el aprendizaje a distancia?`)
Tiempo.dedicado <- as.factor(registro$`¿Cuánto tiempo dedicas cada dÃa en promedio a su educación a distancia?`)
Realizar una nueva base de datos con las variables
Base <- cbind.data.frame(Sexo,Satisfaccion, Tiempo.dedicado)
Base
## Sexo Satisfaccion Tiempo.dedicado
## 1 Hombre 1 5-7 horas
## 2 Mujer 4 5-7 horas
## 3 Mujer 4 3-5 horas
## 4 Mujer 4 3-5 horas
## 5 Mujer 4 3-5 horas
## 6 Hombre 4 5-7 horas
## 7 Mujer 3 7 horas o más
## 8 Mujer 4 7 horas o más
## 9 Mujer 4 5-7 horas
## 10 Mujer 3 7 horas o más
## 11 Mujer 5 7 horas o más
## 12 Mujer 4 7 horas o más
## 13 Hombre 4 5-7 horas
## 14 Mujer 4 5-7 horas
## 15 Hombre 4 3-5 horas
## 16 Mujer 3 7 horas o más
## 17 Mujer 4 5-7 horas
## 18 Mujer 5 3-5 horas
## 19 Mujer 4 7 horas o más
## 20 Hombre 3 3-5 horas
## 21 Mujer 4 3-5 horas
## 22 Hombre 3 5-7 horas
## 23 Mujer 3 5-7 horas
## 24 Mujer 3 5-7 horas
## 25 Mujer 3 5-7 horas
## 26 Mujer 2 5-7 horas
## 27 Hombre 1 3-5 horas
## 28 Mujer 4 5-7 horas
## 29 Mujer 3 3-5 horas
## 30 Mujer 3 3-5 horas
## 31 Hombre 3 3-5 horas
## 32 Mujer 5 5-7 horas
## 33 Mujer 4 5-7 horas
## 34 Hombre 4 5-7 horas
Vector con el número de categorÃas por variable
gt = apply(Base, 2, function(x) nlevels(as.factor(x)))
gt
## Sexo Satisfaccion Tiempo.dedicado
## 2 5 3
Aplicacion del análisis de correspondencia múltiple
mc = MCA(Base, graph = F)
summary(mc)
##
## Call:
## MCA(X = Base, graph = F)
##
##
## Eigenvalues
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
## Variance 0.541 0.414 0.334 0.333 0.294 0.252 0.164
## % of var. 23.188 17.755 14.334 14.286 12.604 10.791 7.042
## Cumulative % of var. 23.188 40.943 55.277 69.563 82.167 92.958 100.000
##
## Individuals (the 10 first)
## Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3 ctr
## 1 | 1.970 21.091 0.585 | 0.121 0.103 0.002 | -0.183 0.294
## 2 | -0.161 0.140 0.031 | 0.651 3.009 0.512 | -0.296 0.769
## 3 | -0.038 0.008 0.001 | -0.163 0.189 0.023 | -0.419 1.545
## 4 | -0.038 0.008 0.001 | -0.163 0.189 0.023 | -0.419 1.545
## 5 | -0.038 0.008 0.001 | -0.163 0.189 0.023 | -0.419 1.545
## 6 | 0.700 2.667 0.300 | 0.555 2.185 0.188 | -0.239 0.502
## 7 | -0.796 3.441 0.301 | -0.672 3.208 0.215 | 0.775 5.279
## 8 | -0.767 3.201 0.339 | -0.119 0.101 0.008 | -0.195 0.334
## 9 | -0.161 0.140 0.031 | 0.651 3.009 0.512 | -0.296 0.769
## 10 | -0.796 3.441 0.301 | -0.672 3.208 0.215 | 0.775 5.279
## cos2
## 1 0.005 |
## 2 0.106 |
## 3 0.153 |
## 4 0.153 |
## 5 0.153 |
## 6 0.035 |
## 7 0.285 |
## 8 0.022 |
## 9 0.106 |
## 10 0.285 |
##
## Categories
## Dim.1 ctr cos2 v.test Dim.2 ctr cos2 v.test
## Hombre | 1.397 31.844 0.703 4.816 | -0.137 0.398 0.007 -0.471 |
## Mujer | -0.503 11.464 0.703 -4.816 | 0.049 0.143 0.007 0.471 |
## 1 | 2.762 27.638 0.477 3.966 | -0.445 0.937 0.012 -0.639 |
## 2 | -0.506 0.464 0.008 -0.506 | 3.558 29.958 0.384 3.558 |
## 3 | -0.102 0.206 0.005 -0.404 | -0.675 11.864 0.218 -2.682 |
## 4 | -0.039 0.048 0.002 -0.226 | 0.393 6.215 0.154 2.258 |
## 5 | -1.077 6.303 0.112 -1.924 | -0.641 2.918 0.040 -1.146 |
## 3-5 horas | 0.459 4.208 0.101 1.825 | -0.758 14.938 0.274 -3.010 |
## 5-7 horas | 0.188 1.021 0.031 1.017 | 0.815 25.143 0.590 4.413 |
## 7 horas o más | -1.151 16.805 0.343 -3.367 | -0.672 7.485 0.117 -1.966 |
## Dim.3 ctr cos2 v.test
## Hombre 0.072 0.138 0.002 0.250 |
## Mujer -0.026 0.050 0.002 -0.250 |
## 1 -0.423 1.047 0.011 -0.607 |
## 2 2.121 13.192 0.136 2.121 |
## 3 1.162 43.534 0.646 4.616 |
## 4 -0.520 13.488 0.271 -2.989 |
## 5 -1.738 26.555 0.292 -3.105 |
## 3-5 horas -0.181 1.055 0.016 -0.718 |
## 5-7 horas 0.033 0.052 0.001 0.180 |
## 7 horas o más 0.208 0.890 0.011 0.609 |
##
## Categorical variables (eta2)
## Dim.1 Dim.2 Dim.3
## Sexo | 0.703 0.007 0.002 |
## Satisfaccion | 0.563 0.645 0.981 |
## Tiempo.dedicado | 0.358 0.591 0.020 |
Data frames.
mcv = data.frame(mc$var$coord, Variable = rep(names(gt), gt))
mco = data.frame(mc$ind$coord)
Gráfico con respecto a los data frames
ggplot(data = mco, aes(x = Dim.1, y = Dim.2)) + geom_hline(yintercept = 0,
colour = "gray70") + geom_vline(xintercept = 0, colour = "gray70") + geom_point(colour = "gray50", alpha = 0.7) + geom_density2d(colour = "gray80") + geom_text(data = mcv, aes(x = Dim.1, y = Dim.2, label = rownames(mcv), colour = Variable)) + ggtitle("ACM con las variables") + scale_colour_discrete(name = "Variable") +theme_minimal()
Se puede observarse que los hombres a diario dedican de 3 a 5 horas de estudio. También se puede observar que los estudiantes no están muy satisfechos con respecto a las aplicaciones o plataformas utilizadas para el aprendizaje en lÃnea.
Gráfico de las variables de categoria
ggplot(data = mcv, aes(x = Dim.1, y = Dim.2, label = rownames(mcv))) +
geom_hline(yintercept = 0, colour = "gray70") + geom_vline(xintercept = 0,
colour = "gray70") + geom_text(aes(colour = Variable)) + ggtitle("MCA plot of variables using R package FactoMineR")
Biplot predeterminado en FactoMineR
plot(mc)
## Warning: ggrepel: 6 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps