library(foreign)
library(plyr)
library(dplyr)
library(ggplot2)
library(knitr)
load("dataset.RData")
graduandos <- read.spss("GRADUANDOS 2014.sav", to.data.frame=TRUE, reencode=TRUE)
save(graduandos,file="dataset.RData")
Guatemala se divide en 8 diferentes regiones. En esta ocasión, buscamos ver si la región en la que estudien los estudiantes influye en su desempeño académico. ##MATE
En la siguiente grafica se quiso mostrar el desempeño junto con measure en mate de cada estudiante dependiendo de la region en la que estudie. Se puede observar que sí hay una diferencia entre las diferentes regiones en las que se encuentren, siendo la Metropolitana la que muestra un nivel mas alto, seguida por la Suroccidental y luego por la Noroccidental. Esto se puede confirmar en la tabla, en donde se encuentra la información graficada más detallada.
| INSATISFACTORIO | DEBE MEJORAR | SATISFACTORIO | EXCELENTE | |
|---|---|---|---|---|
| REGIÓN 1 o METROPOLITANA | 30519 | 15832 | 2805 | 5050 |
| REGIÓN 2 o NORTE | 6886 | 2276 | 196 | 233 |
| REGIÓN 3 o NORORIENTAL | 8592 | 2894 | 306 | 322 |
| REGIÓN 4 o SURORIENTAL | 10906 | 3164 | 207 | 200 |
| REGIÓN 5 o CENTRAL | 10999 | 5399 | 662 | 1005 |
| REGIÓN 6 o SUROCCIDENTAL | 27781 | 11219 | 1219 | 1347 |
| REGIÓN 7 o NOROCCIDENTAL | 11338 | 4113 | 410 | 442 |
| REGIÓN 8 o PETÉN | 4280 | 1229 | 85 | 77 |
En la siguiente gráfica se muestra la relación solamente entre logro de mate y región. En el eje x se empieza por la región uno hasta la izquierda y sigue hacia la derecha hasta llegar a la región 8. Se puede observar que también la región Metropolitana es la que muestra el nivel más alto, seguida por la Central y luego la Suroccidental.
En la siguiente gráfica se muestra la relación entre la región con desempeño, en donde la región Metropolitana vuelve a mostrar el mejor desempeño, teniendo el mayor número de estudiantes que resultaron en excelente, así como en satisfactorio y en “debe mejorar”. Despues de esta, se encuentra la región central, seguida por la Suroccidental.
La siguiente gráfica muestra la relación entre region y measure. La región Metropolitana y Central vuelven a mostrar el mejor resultado.
Teniendo ya una idea de como se encuentran los estudiantes según su región, realizamos una prueba de hipotesis en donde:
| X1 | X2 | P value | Diferencia |
|---|---|---|---|
| Región norte | Metropolitana | 0.0000000 | -0.354345207 |
| Nororiental | Metropolitana | 0.0000000 | -0.316337043 |
| Suroriental | Metropolitana | 0.0000000 | -0.389422030 |
| Noroccidental | Metropolitana | 0.0000000 | -0.301447188 |
| Petén | Metropolitana | 0.0000000 | -0.396660559 |
| Suroccidental | Metropolitana | 0.0000000 | -0.255090784 |
| Central | Norte | 0.0000000 | 0.209457846 |
| Central | Suroriental | 0.0000000 | 0.244534670 |
| Petén | Central | 0.0000000 | -0.251773198 |
La tabla anterior muestra la relación entre las regiones que tienen diferencias más significativas. Podemos concluir que la hipotesis nula se rechaza, si hay diferencia entre las regiones y los resultados de los estudiantes. La región que mejores resultados tiene es la Metropolitana, seguida por la Central.
## Df Sum Sq Mean Sq F value Pr(>F)
## graduandos$REGION 7 3641 520.1 722.6 <2e-16 ***
## Residuals 171985 123793 0.7
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = graduandos$measure_MATE ~ graduandos$REGION)
##
## $`graduandos$REGION`
## diff lwr upr p adj
## NORTE-METRO -0.354345207 -0.382830205 -0.3258602094 0.0000000
## NOROR-METRO -0.316337043 -0.342179064 -0.2904950216 0.0000000
## SUROR-METRO -0.389422030 -0.413478580 -0.3653654803 0.0000000
## CENTRAL-METRO -0.144887361 -0.166978141 -0.1227965805 0.0000000
## SUROC-METRO -0.255090784 -0.271855576 -0.2383259920 0.0000000
## NOROC-METRO -0.301447188 -0.324415893 -0.2784784825 0.0000000
## PETÉN-METRO -0.396660559 -0.432548472 -0.3607726466 0.0000000
## NOROR-NORTE 0.038008164 0.002862169 0.0731541598 0.0233144
## SUROR-NORTE -0.035076823 -0.068931639 -0.0012220076 0.0360013
## CENTRAL-NORTE 0.209457846 0.176970410 0.2419452826 0.0000000
## SUROC-NORTE 0.099254423 0.070125585 0.1283832610 0.0000000
## NOROC-NORTE 0.052898019 0.019807350 0.0859886882 0.0000347
## PETÉN-NORTE -0.042315352 -0.085389395 0.0007586913 0.0583571
## SUROR-NOROR -0.073084988 -0.104748271 -0.0414217041 0.0000000
## CENTRAL-NOROR 0.171449682 0.141252853 0.2016465112 0.0000000
## SUROC-NOROR 0.061246259 0.034696228 0.0877962902 0.0000000
## NOROC-NOROR 0.014889855 -0.015955037 0.0457347466 0.8271194
## PETÉN-NOROR -0.080323516 -0.121697278 -0.0389497543 0.0000001
## CENTRAL-SUROR 0.244534670 0.215850946 0.2732183937 0.0000000
## SUROC-SUROR 0.134331246 0.109515693 0.1591468001 0.0000000
## NOROC-SUROR 0.087974842 0.058609644 0.1173400410 0.0000000
## PETÉN-SUROR -0.007238529 -0.047521226 0.0330441688 0.9994095
## SUROC-CENTRAL -0.110203423 -0.133118411 -0.0872884353 0.0000000
## NOROC-CENTRAL -0.156559827 -0.184337513 -0.1287821410 0.0000000
## PETÉN-CENTRAL -0.251773198 -0.290913723 -0.2126326735 0.0000000
## NOROC-SUROC -0.046356404 -0.070118886 -0.0225939224 0.0000001
## PETÉN-SUROC -0.141569775 -0.177970824 -0.1051687262 0.0000000
## PETÉN-NOROC -0.095213371 -0.134856019 -0.0555707231 0.0000000
En la siguiente grafica se quiso mostrar el desempeño junto con measure en lectura de cada estudiante dependiendo de la region en la que estudie. Se puede observar que sí hay una diferencia entre las diferentes regiones en las que se encuentren, siendo la Metropolitana la que muestra un nivel mas alto al igual que en mate. Le sigue la Suroccidental y luego por la Central como se confirma en la tabla.
| INSATISFACTORIO | DEBE MEJORAR | SATISFACTORIO | EXCELENTE | |
|---|---|---|---|---|
| METRO | 19936 | 14100 | 8395 | 11775 |
| NORTE | 5408 | 2371 | 965 | 847 |
| NOROR | 5753 | 3502 | 1479 | 1380 |
| SUROR | 7553 | 4054 | 1636 | 1234 |
| CENTRAL | 8223 | 5047 | 2426 | 2369 |
| SUROC | 22239 | 10929 | 4526 | 3872 |
| NOROC | 9606 | 3899 | 1473 | 1325 |
| PETÉN | 3094 | 1534 | 594 | 449 |
En la siguiente gráfica se muestra la relación solamente entre logro de lectura y región. Se puede observar que también la región Metropolitana es la que muestra el nivel más alto, seguida por la Central y luego la Suroccidental como en matemática.
En la siguiente gráfica se muestra la relación entre la región con desempeño, en donde la región Metropolitana vuelve a mostrar el mejor desempeño, teniendo el mayor número de estudiantes que resultaron en excelente, así como en satisfactorio y en “debe mejorar”. Despues de esta, se encuentra la región central, seguida por la Nororiental.
La siguiente gráfica muestra la relación entre region y measure. La región Metropolitana y Central vuelven a mostrar el mejor resultado.
| X1 | X2 | P value | Diferencia |
|---|---|---|---|
| Región norte | Metropolitana | 0.0000000 | -0.354345207 |
| Nororiental | Metropolitana | 0.0000000 | -0.316337043 |
| Suroriental | Metropolitana | 0.0000000 | -0.389422030 |
| Suroccidental | Metropolitana | 0.0000000 | -0.255090784 |
| Noroccidental | Metropolitana | 0.0000000 | -0.301447188 |
| Petén | Metropolitana | 0.0000000 | -0.396660559 |
| Central | Norte | 0.0000000 | 0.209457846 |
| Central | Suroriental | 0.0000000 | 0.244534670 |
| Petén | Central | 0.0000000 | -0.251773198 |
Se rechaza la hipótesis nula, lo que quiere decir que en lectura tambien hay una diferencia entre las regiones y los resultados de los estudiantes. Las regiones mas significativas son las mismas que en matemáticas. La Metropolitana es la región con mayores resultados, seguida por la Central.
## Df Sum Sq Mean Sq F value Pr(>F)
## graduandos$REGION 7 4865 695.0 1117 <2e-16 ***
## Residuals 171985 107037 0.6
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = graduandos$measure_MATE ~ graduandos$REGION)
##
## $`graduandos$REGION`
## diff lwr upr p adj
## NORTE-METRO -0.354345207 -0.382830205 -0.3258602094 0.0000000
## NOROR-METRO -0.316337043 -0.342179064 -0.2904950216 0.0000000
## SUROR-METRO -0.389422030 -0.413478580 -0.3653654803 0.0000000
## CENTRAL-METRO -0.144887361 -0.166978141 -0.1227965805 0.0000000
## SUROC-METRO -0.255090784 -0.271855576 -0.2383259920 0.0000000
## NOROC-METRO -0.301447188 -0.324415893 -0.2784784825 0.0000000
## PETÉN-METRO -0.396660559 -0.432548472 -0.3607726466 0.0000000
## NOROR-NORTE 0.038008164 0.002862169 0.0731541598 0.0233144
## SUROR-NORTE -0.035076823 -0.068931639 -0.0012220076 0.0360013
## CENTRAL-NORTE 0.209457846 0.176970410 0.2419452826 0.0000000
## SUROC-NORTE 0.099254423 0.070125585 0.1283832610 0.0000000
## NOROC-NORTE 0.052898019 0.019807350 0.0859886882 0.0000347
## PETÉN-NORTE -0.042315352 -0.085389395 0.0007586913 0.0583571
## SUROR-NOROR -0.073084988 -0.104748271 -0.0414217041 0.0000000
## CENTRAL-NOROR 0.171449682 0.141252853 0.2016465112 0.0000000
## SUROC-NOROR 0.061246259 0.034696228 0.0877962902 0.0000000
## NOROC-NOROR 0.014889855 -0.015955037 0.0457347466 0.8271194
## PETÉN-NOROR -0.080323516 -0.121697278 -0.0389497543 0.0000001
## CENTRAL-SUROR 0.244534670 0.215850946 0.2732183937 0.0000000
## SUROC-SUROR 0.134331246 0.109515693 0.1591468001 0.0000000
## NOROC-SUROR 0.087974842 0.058609644 0.1173400410 0.0000000
## PETÉN-SUROR -0.007238529 -0.047521226 0.0330441688 0.9994095
## SUROC-CENTRAL -0.110203423 -0.133118411 -0.0872884353 0.0000000
## NOROC-CENTRAL -0.156559827 -0.184337513 -0.1287821410 0.0000000
## PETÉN-CENTRAL -0.251773198 -0.290913723 -0.2126326735 0.0000000
## NOROC-SUROC -0.046356404 -0.070118886 -0.0225939224 0.0000001
## PETÉN-SUROC -0.141569775 -0.177970824 -0.1051687262 0.0000000
## PETÉN-NOROC -0.095213371 -0.134856019 -0.0555707231 0.0000000