library(foreign)
library(plyr)
library(dplyr)
library(ggplot2)
library(knitr)
load("dataset.RData")
graduandos <- read.spss("GRADUANDOS 2014.sav", to.data.frame=TRUE, reencode=TRUE)
save(graduandos,file="dataset.RData")

Guatemala se divide en 8 diferentes regiones. En esta ocasión, buscamos ver si la región en la que estudien los estudiantes influye en su desempeño académico. ##MATE
En la siguiente grafica se quiso mostrar el desempeño junto con measure en mate de cada estudiante dependiendo de la region en la que estudie. Se puede observar que sí hay una diferencia entre las diferentes regiones en las que se encuentren, siendo la Metropolitana la que muestra un nivel mas alto, seguida por la Suroccidental y luego por la Noroccidental. Esto se puede confirmar en la tabla, en donde se encuentra la información graficada más detallada.

INSATISFACTORIO DEBE MEJORAR SATISFACTORIO EXCELENTE
REGIÓN 1 o METROPOLITANA 30519 15832 2805 5050
REGIÓN 2 o NORTE 6886 2276 196 233
REGIÓN 3 o NORORIENTAL 8592 2894 306 322
REGIÓN 4 o SURORIENTAL 10906 3164 207 200
REGIÓN 5 o CENTRAL 10999 5399 662 1005
REGIÓN 6 o SUROCCIDENTAL 27781 11219 1219 1347
REGIÓN 7 o NOROCCIDENTAL 11338 4113 410 442
REGIÓN 8 o PETÉN 4280 1229 85 77


En la siguiente gráfica se muestra la relación solamente entre logro de mate y región. En el eje x se empieza por la región uno hasta la izquierda y sigue hacia la derecha hasta llegar a la región 8. Se puede observar que también la región Metropolitana es la que muestra el nivel más alto, seguida por la Central y luego la Suroccidental.


En la siguiente gráfica se muestra la relación entre la región con desempeño, en donde la región Metropolitana vuelve a mostrar el mejor desempeño, teniendo el mayor número de estudiantes que resultaron en excelente, así como en satisfactorio y en “debe mejorar”. Despues de esta, se encuentra la región central, seguida por la Suroccidental.
La siguiente gráfica muestra la relación entre region y measure. La región Metropolitana y Central vuelven a mostrar el mejor resultado.


Teniendo ya una idea de como se encuentran los estudiantes según su región, realizamos una prueba de hipotesis en donde:

X1 X2 P value Diferencia
Región norte Metropolitana 0.0000000 -0.354345207
Nororiental Metropolitana 0.0000000 -0.316337043
Suroriental Metropolitana 0.0000000 -0.389422030
Noroccidental Metropolitana 0.0000000 -0.301447188
Petén Metropolitana 0.0000000 -0.396660559
Suroccidental Metropolitana 0.0000000 -0.255090784
Central Norte 0.0000000 0.209457846
Central Suroriental 0.0000000 0.244534670
Petén Central 0.0000000 -0.251773198

Conclusión


La tabla anterior muestra la relación entre las regiones que tienen diferencias más significativas. Podemos concluir que la hipotesis nula se rechaza, si hay diferencia entre las regiones y los resultados de los estudiantes. La región que mejores resultados tiene es la Metropolitana, seguida por la Central.

##                       Df Sum Sq Mean Sq F value Pr(>F)    
## graduandos$REGION      7   3641   520.1   722.6 <2e-16 ***
## Residuals         171985 123793     0.7                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = graduandos$measure_MATE ~ graduandos$REGION)
## 
## $`graduandos$REGION`
##                       diff          lwr           upr     p adj
## NORTE-METRO   -0.354345207 -0.382830205 -0.3258602094 0.0000000
## NOROR-METRO   -0.316337043 -0.342179064 -0.2904950216 0.0000000
## SUROR-METRO   -0.389422030 -0.413478580 -0.3653654803 0.0000000
## CENTRAL-METRO -0.144887361 -0.166978141 -0.1227965805 0.0000000
## SUROC-METRO   -0.255090784 -0.271855576 -0.2383259920 0.0000000
## NOROC-METRO   -0.301447188 -0.324415893 -0.2784784825 0.0000000
## PETÉN-METRO   -0.396660559 -0.432548472 -0.3607726466 0.0000000
## NOROR-NORTE    0.038008164  0.002862169  0.0731541598 0.0233144
## SUROR-NORTE   -0.035076823 -0.068931639 -0.0012220076 0.0360013
## CENTRAL-NORTE  0.209457846  0.176970410  0.2419452826 0.0000000
## SUROC-NORTE    0.099254423  0.070125585  0.1283832610 0.0000000
## NOROC-NORTE    0.052898019  0.019807350  0.0859886882 0.0000347
## PETÉN-NORTE   -0.042315352 -0.085389395  0.0007586913 0.0583571
## SUROR-NOROR   -0.073084988 -0.104748271 -0.0414217041 0.0000000
## CENTRAL-NOROR  0.171449682  0.141252853  0.2016465112 0.0000000
## SUROC-NOROR    0.061246259  0.034696228  0.0877962902 0.0000000
## NOROC-NOROR    0.014889855 -0.015955037  0.0457347466 0.8271194
## PETÉN-NOROR   -0.080323516 -0.121697278 -0.0389497543 0.0000001
## CENTRAL-SUROR  0.244534670  0.215850946  0.2732183937 0.0000000
## SUROC-SUROR    0.134331246  0.109515693  0.1591468001 0.0000000
## NOROC-SUROR    0.087974842  0.058609644  0.1173400410 0.0000000
## PETÉN-SUROR   -0.007238529 -0.047521226  0.0330441688 0.9994095
## SUROC-CENTRAL -0.110203423 -0.133118411 -0.0872884353 0.0000000
## NOROC-CENTRAL -0.156559827 -0.184337513 -0.1287821410 0.0000000
## PETÉN-CENTRAL -0.251773198 -0.290913723 -0.2126326735 0.0000000
## NOROC-SUROC   -0.046356404 -0.070118886 -0.0225939224 0.0000001
## PETÉN-SUROC   -0.141569775 -0.177970824 -0.1051687262 0.0000000
## PETÉN-NOROC   -0.095213371 -0.134856019 -0.0555707231 0.0000000

LECTURA


En la siguiente grafica se quiso mostrar el desempeño junto con measure en lectura de cada estudiante dependiendo de la region en la que estudie. Se puede observar que sí hay una diferencia entre las diferentes regiones en las que se encuentren, siendo la Metropolitana la que muestra un nivel mas alto al igual que en mate. Le sigue la Suroccidental y luego por la Central como se confirma en la tabla.

INSATISFACTORIO DEBE MEJORAR SATISFACTORIO EXCELENTE
METRO 19936 14100 8395 11775
NORTE 5408 2371 965 847
NOROR 5753 3502 1479 1380
SUROR 7553 4054 1636 1234
CENTRAL 8223 5047 2426 2369
SUROC 22239 10929 4526 3872
NOROC 9606 3899 1473 1325
PETÉN 3094 1534 594 449


En la siguiente gráfica se muestra la relación solamente entre logro de lectura y región. Se puede observar que también la región Metropolitana es la que muestra el nivel más alto, seguida por la Central y luego la Suroccidental como en matemática.


En la siguiente gráfica se muestra la relación entre la región con desempeño, en donde la región Metropolitana vuelve a mostrar el mejor desempeño, teniendo el mayor número de estudiantes que resultaron en excelente, así como en satisfactorio y en “debe mejorar”. Despues de esta, se encuentra la región central, seguida por la Nororiental.


La siguiente gráfica muestra la relación entre region y measure. La región Metropolitana y Central vuelven a mostrar el mejor resultado.

X1 X2 P value Diferencia
Región norte Metropolitana 0.0000000 -0.354345207
Nororiental Metropolitana 0.0000000 -0.316337043
Suroriental Metropolitana 0.0000000 -0.389422030
Suroccidental Metropolitana 0.0000000 -0.255090784
Noroccidental Metropolitana 0.0000000 -0.301447188
Petén Metropolitana 0.0000000 -0.396660559
Central Norte 0.0000000 0.209457846
Central Suroriental 0.0000000 0.244534670
Petén Central 0.0000000 -0.251773198

Conclusión


Se rechaza la hipótesis nula, lo que quiere decir que en lectura tambien hay una diferencia entre las regiones y los resultados de los estudiantes. Las regiones mas significativas son las mismas que en matemáticas. La Metropolitana es la región con mayores resultados, seguida por la Central.

##                       Df Sum Sq Mean Sq F value Pr(>F)    
## graduandos$REGION      7   4865   695.0    1117 <2e-16 ***
## Residuals         171985 107037     0.6                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = graduandos$measure_MATE ~ graduandos$REGION)
## 
## $`graduandos$REGION`
##                       diff          lwr           upr     p adj
## NORTE-METRO   -0.354345207 -0.382830205 -0.3258602094 0.0000000
## NOROR-METRO   -0.316337043 -0.342179064 -0.2904950216 0.0000000
## SUROR-METRO   -0.389422030 -0.413478580 -0.3653654803 0.0000000
## CENTRAL-METRO -0.144887361 -0.166978141 -0.1227965805 0.0000000
## SUROC-METRO   -0.255090784 -0.271855576 -0.2383259920 0.0000000
## NOROC-METRO   -0.301447188 -0.324415893 -0.2784784825 0.0000000
## PETÉN-METRO   -0.396660559 -0.432548472 -0.3607726466 0.0000000
## NOROR-NORTE    0.038008164  0.002862169  0.0731541598 0.0233144
## SUROR-NORTE   -0.035076823 -0.068931639 -0.0012220076 0.0360013
## CENTRAL-NORTE  0.209457846  0.176970410  0.2419452826 0.0000000
## SUROC-NORTE    0.099254423  0.070125585  0.1283832610 0.0000000
## NOROC-NORTE    0.052898019  0.019807350  0.0859886882 0.0000347
## PETÉN-NORTE   -0.042315352 -0.085389395  0.0007586913 0.0583571
## SUROR-NOROR   -0.073084988 -0.104748271 -0.0414217041 0.0000000
## CENTRAL-NOROR  0.171449682  0.141252853  0.2016465112 0.0000000
## SUROC-NOROR    0.061246259  0.034696228  0.0877962902 0.0000000
## NOROC-NOROR    0.014889855 -0.015955037  0.0457347466 0.8271194
## PETÉN-NOROR   -0.080323516 -0.121697278 -0.0389497543 0.0000001
## CENTRAL-SUROR  0.244534670  0.215850946  0.2732183937 0.0000000
## SUROC-SUROR    0.134331246  0.109515693  0.1591468001 0.0000000
## NOROC-SUROR    0.087974842  0.058609644  0.1173400410 0.0000000
## PETÉN-SUROR   -0.007238529 -0.047521226  0.0330441688 0.9994095
## SUROC-CENTRAL -0.110203423 -0.133118411 -0.0872884353 0.0000000
## NOROC-CENTRAL -0.156559827 -0.184337513 -0.1287821410 0.0000000
## PETÉN-CENTRAL -0.251773198 -0.290913723 -0.2126326735 0.0000000
## NOROC-SUROC   -0.046356404 -0.070118886 -0.0225939224 0.0000001
## PETÉN-SUROC   -0.141569775 -0.177970824 -0.1051687262 0.0000000
## PETÉN-NOROC   -0.095213371 -0.134856019 -0.0555707231 0.0000000