Column

InformaciĂ³n General

En primer lugar, se considera a una persona como analfabeta cuando tiene 15 y mĂ¡s años de edad y no sabe leer ni escribir. Las preguntas para captar a la poblaciĂ³n analfabeta y alfabeta en la Encuesta Nacional de Hogares tienen el siguiente procedimiento:

  1. Se pregunta el nivel de educaciĂ³n logrado de las personas entrevistadas.
  2. A las personas con primaria incompleta o menor nivel educativo, se les consulta si tienen la habilidad de leer y escribir.
  3. A las personas que respondieron afirmativamente, se les pide leer una cartilla para corroborar si efectivamente saben leer.

Column

HipĂ³tesis 1

El dato mĂ¡s mencionado en los trabajos acadĂ©micos ha sido que los espacios rurales son los que mayor presentan niveles de analfabetismo, es por ello que considerarlo una variable que afecta a la dependiente es fundamental. Esto es posible a que las zonas rurales cuentan con menos accesos a servicios educativos, subiendo el porcentaje de personas analfabetas. SegĂºn los resultados se han encontrado que el coeficiente es altamente significativo (p<0.001), lo que indica una fuerte asociaciĂ³n positiva entre el porcentaje de zonas rurales y el porcentaje de analfabetismo.Sin embargo, se encuentra que otras variables podrĂ­an ayudar al modelo


1.1. Resultado del modelo


Call:
lm(formula = mi_tabla$PORCENTAJEANALFABETISMO ~ mi_tabla$`Rural porcentaje`)

Residuals:
     Min       1Q   Median       3Q      Max 
-13.4631  -3.3179  -0.4789   3.2180  18.6183 

Coefficients:
                            Estimate Std. Error t value Pr(>|t|)    
(Intercept)                   5.4432     0.7798   6.981 4.78e-11 ***
mi_tabla$`Rural porcentaje`  13.1021     1.2535  10.453  < 2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5.141 on 190 degrees of freedom
Multiple R-squared:  0.3651,    Adjusted R-squared:  0.3618 
F-statistic: 109.3 on 1 and 190 DF,  p-value: < 2.2e-16
Regresion: modelo 1
Resultado
(Intercept) 5.443***
(0.780)
mi_tabla$Rural porcentaje 13.102***
(1.253)
Num.Obs. 192
R2 0.365
R2 Adj. 0.362
AIC 1177.6
BIC 1187.3
Log.Lik. -585.780
RMSE 5.11
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

1.1. GrĂ¡fico del modelo

HipĂ³tesis 2

El wifi ha sido una herramienta importante para la educaciĂ³n, especialmente durante el COVID 19 lo cual nos parece relevante analizar. SegĂºn los resultados se han encontrado que el coeficiente es altamente significativo (p<0.001), lo que indica una fuerte asociaciĂ³n positiva entre el porcentaje de zonas sin wifi y el porcentaje de analfabetismo.Sin embargo, se encuentra que otras variables podrĂ­an ayudar al modelo


Call:
lm(formula = mi_tabla$PORCENTAJEANALFABETISMO ~ mi_tabla$`SIN WIFI`)

Residuals:
    Min      1Q  Median      3Q     Max 
-11.078  -3.955  -1.056   3.870  18.868 

Coefficients:
                    Estimate Std. Error t value Pr(>|t|)    
(Intercept)          15.8769     0.5175  30.681   <2e-16 ***
mi_tabla$`SIN WIFI` -36.1054     3.8316  -9.423   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5.326 on 190 degrees of freedom
Multiple R-squared:  0.3185,    Adjusted R-squared:  0.3149 
F-statistic:  88.8 on 1 and 190 DF,  p-value: < 2.2e-16
Regresion: modelo 2
Resultado
(Intercept) 15.877***
(0.517)
mi_tabla$SIN WIFI -36.105***
(3.832)
Num.Obs. 192
R2 0.318
R2 Adj. 0.315
AIC 1191.2
BIC 1200.9
Log.Lik. -592.579
RMSE 5.30
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

HipĂ³tesis 3

Las diferentes lenguas del PerĂº causan que ciertas personas no puedan acceder a la educaciĂ³n debido a que no hay colegios o personal especializado a su idioma, lo que puede llevar amayores tazas de analfabetismo. SegĂºn los resultados se han encontrado que el coeficiente es altamente significativo (p<0.001), lo que indica una fuerte asociaciĂ³n positiva entre el porcentaje de provincias con lenguas diferentes y el porcentaje de analfabetismo.Sin embargo, se encuentra que otras variables podrĂ­an ayudar al modelo


Call:
lm(formula = mi_tabla$PORCENTAJEANALFABETISMO ~ mi_tabla$PORCENTAJELENGUA)

Residuals:
    Min      1Q  Median      3Q     Max 
-8.8941 -3.3999 -0.6755  2.8627 16.4828 

Coefficients:
                          Estimate Std. Error t value Pr(>|t|)    
(Intercept)                8.32642    0.50707   16.42   <2e-16 ***
mi_tabla$PORCENTAJELENGUA  0.13599    0.01153   11.80   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 4.902 on 190 degrees of freedom
Multiple R-squared:  0.4228,    Adjusted R-squared:  0.4197 
F-statistic: 139.2 on 1 and 190 DF,  p-value: < 2.2e-16
Regresion: modelo 3
Resultado
(Intercept) 8.326***
(0.507)
mi_tabla$PORCENTAJELENGUA 0.136***
(0.012)
Num.Obs. 192
R2 0.423
R2 Adj. 0.420
AIC 1159.3
BIC 1169.0
Log.Lik. -576.636
RMSE 4.88
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

HipĂ³tesis 4

Las necesidades basicas insatisfechas pueden causar que las personas se les dificulte acceder o aprovechar de manera correcta la educaciĂ³n debido a otras necesidades que no se esten cumpliendo. SegĂºn los resultados se han encontrado que el coeficiente no es significativo, lo que indica no asociaciĂ³n entre el porcentaje de zonas rurales y el porcentaje de analfabetismo. Esto implica que los NBIs no son una variable independiente relevante para la analfabetizacion


Call:
lm(formula = mi_tabla$PORCENTAJEANALFABETISMO ~ mi_tabla$PORCENTAJENBI)

Residuals:
     Min       1Q   Median       3Q      Max 
-10.6267  -5.2058  -0.8158   4.9398  21.3293 

Coefficients:
                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)            10.26860    2.10307   4.883 2.21e-06 ***
mi_tabla$PORCENTAJENBI  0.08139    0.07124   1.142    0.255    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 6.43 on 190 degrees of freedom
Multiple R-squared:  0.006823,  Adjusted R-squared:  0.001595 
F-statistic: 1.305 on 1 and 190 DF,  p-value: 0.2547
Regresion: modelo 4
Resultado
(Intercept) 10.269***
(2.103)
mi_tabla$PORCENTAJENBI 0.081
(0.071)
Num.Obs. 192
R2 0.007
R2 Adj. 0.002
AIC 1263.5
BIC 1273.2
Log.Lik. -628.734
RMSE 6.40
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

HipĂ³tesis 5

Las mujeres usualmente no encuentran un espacio en la educaciĂ³n a veces dependiendo de su situacion sea familiar, economica, entre otras.Se han encontrado que el coeficiente es altamente significativo (p<0.001), lo que indica una fuerte asociaciĂ³n positiva entre el porcentaje de zonas rurales y el porcentaje de analfabetismo.Sin embargo, se encuentra que otras variables podrĂ­an ayudar al modelo


Call:
lm(formula = mi_tabla$PORCENTAJEANALFABETISMO ~ mi_tabla$`Porcentaje Mujer`)

Residuals:
     Min       1Q   Median       3Q      Max 
-13.2878  -4.4269  -0.2083   3.6347  18.3851 

Coefficients:
                            Estimate Std. Error t value Pr(>|t|)    
(Intercept)                    73.49      11.23   6.546 5.37e-10 ***
mi_tabla$`Porcentaje Mujer`  -121.35      22.36  -5.427 1.74e-07 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 6.003 on 190 degrees of freedom
Multiple R-squared:  0.1342,    Adjusted R-squared:  0.1296 
F-statistic: 29.45 on 1 and 190 DF,  p-value: 1.737e-07
Regresion: modelo 5
Resultado
(Intercept) 73.486***
(11.226)
mi_tabla$Porcentaje Mujer -121.354***
(22.363)
Num.Obs. 192
R2 0.134
R2 Adj. 0.130
AIC 1237.1
BIC 1246.9
Log.Lik. -615.559
RMSE 5.97
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

HipĂ³tesis 6

Se ha visto modelos anidados donde las zonas rurales usualmente comparten relacion con las zonas que no tienen acceso a Internet.Se han encontrado que el coeficiente es altamente significativo (p<0.001), lo que indica una fuerte asociaciĂ³n positiva entre el porcentaje de zonas rurales, zonas sin acceso a internet y el porcentaje de analfabetismo.


Call:
lm(formula = mi_tabla$PORCENTAJEANALFABETISMO ~ mi_tabla$`Rural porcentaje` + 
    mi_tabla$`SIN WIFI`)

Residuals:
     Min       1Q   Median       3Q      Max 
-12.9501  -3.0554  -0.5483   3.0375  18.4920 

Coefficients:
                            Estimate Std. Error t value Pr(>|t|)    
(Intercept)                    8.449      1.854   4.557 9.30e-06 ***
mi_tabla$`Rural porcentaje`    9.622      2.314   4.158 4.86e-05 ***
mi_tabla$`SIN WIFI`          -12.185      6.827  -1.785   0.0759 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 5.112 on 189 degrees of freedom
Multiple R-squared:  0.3756,    Adjusted R-squared:  0.369 
F-statistic: 56.85 on 2 and 189 DF,  p-value: < 2.2e-16
Regresion: modelo 6
Resultado
(Intercept) 8.449***
(1.854)
mi_tabla\(Rural porcentaje </td> <td style="text-align:center;"> 9.622*** </td> </tr> <tr> <td style="text-align:left;"> </td> <td style="text-align:center;"> (2.314) </td> </tr> <tr> <td style="text-align:left;"> mi_tabla\)SIN WIFI -12.185+
(6.827)
Num.Obs. 192
R2 0.376
R2 Adj. 0.369
AIC 1176.4
BIC 1189.4
Log.Lik. -584.176
RMSE 5.07
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

HipĂ³tesis 7

Se ha visto modelos anidados donde las zonas rurales usualmente comparten relacion con las zonas que no tienen acceso a Internet.Aparte, se ha decidido incluir el valor de lengua para ver si este influia en un mejor modelo. Se han encontrado que el coeficiente es altamente significativo (p<0.001), lo que indica una fuerte asociaciĂ³n positiva entre el porcentaje de zonas rurales, zonas sin acceso a internet y el porcentaje de analfabetismo.


Call:
lm(formula = mi_tabla$PORCENTAJEANALFABETISMO ~ mi_tabla$`Rural porcentaje` + 
    mi_tabla$`SIN WIFI` + mi_tabla$PORCENTAJELENGUA)

Residuals:
    Min      1Q  Median      3Q     Max 
-9.0257 -2.8453 -0.4133  2.6701 14.5937 

Coefficients:
                            Estimate Std. Error t value Pr(>|t|)    
(Intercept)                  7.20657    1.58370   4.550 9.59e-06 ***
mi_tabla$`Rural porcentaje`  5.79725    2.01839   2.872  0.00454 ** 
mi_tabla$`SIN WIFI`         -9.51366    5.81561  -1.636  0.10354    
mi_tabla$PORCENTAJELENGUA    0.09817    0.01147   8.558 4.02e-15 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 4.348 on 188 degrees of freedom
Multiple R-squared:  0.5507,    Adjusted R-squared:  0.5435 
F-statistic:  76.8 on 3 and 188 DF,  p-value: < 2.2e-16
Regresion: modelo 7
Resultado
(Intercept) 8.449***
(1.854)
mi_tabla\(Rural porcentaje </td> <td style="text-align:center;"> 9.622*** </td> </tr> <tr> <td style="text-align:left;"> </td> <td style="text-align:center;"> (2.314) </td> </tr> <tr> <td style="text-align:left;"> mi_tabla\)SIN WIFI -12.185+
(6.827)
Num.Obs. 192
R2 0.376
R2 Adj. 0.369
AIC 1176.4
BIC 1189.4
Log.Lik. -584.176
RMSE 5.07
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Annova

De los modelos podemos encontrar que el mejor modelo es el 7 debido a que es el mĂ¡s significativo mostrandonos un modelo anidado completo

Analysis of Variance Table

Model 1: mi_tabla$PORCENTAJEANALFABETISMO ~ mi_tabla$`Rural porcentaje`
Model 2: mi_tabla$PORCENTAJEANALFABETISMO ~ mi_tabla$`SIN WIFI`
Model 3: mi_tabla$PORCENTAJEANALFABETISMO ~ mi_tabla$PORCENTAJELENGUA
Model 4: mi_tabla$PORCENTAJEANALFABETISMO ~ mi_tabla$PORCENTAJENBI
Model 5: mi_tabla$PORCENTAJEANALFABETISMO ~ mi_tabla$`Porcentaje Mujer`
Model 6: mi_tabla$PORCENTAJEANALFABETISMO ~ mi_tabla$`Rural porcentaje` + 
    mi_tabla$`SIN WIFI`
Model 7: mi_tabla$PORCENTAJEANALFABETISMO ~ mi_tabla$`Rural porcentaje` + 
    mi_tabla$`SIN WIFI` + mi_tabla$PORCENTAJELENGUA
  Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
1    190 5021.6                                  
2    190 5390.1  0    -368.5                     
3    190 4565.3  0     824.8                     
4    190 7855.2  0   -3289.9                     
5    190 6847.8  0    1007.3                     
6    189 4938.3  1    1909.5 101.01 < 2.2e-16 ***
7    188 3553.8  1    1384.5  73.24 4.017e-15 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

#ANALISIS FACTORIAL

Se ha encontrado dos factores relevantes: Las variables Rural porcentaje, SIN WIFI, y PORCENTAJENBI estĂ¡n fuertemente correlacionadas con PORCENTAJEANALFABETISMO, lo que las convierte en predictores clave para estudiar el fenĂ³meno del analfabetismo. Las correlaciones negativas con CON WIFI destacan la importancia del acceso a la tecnologĂ­a como un factor determinante para mejorar la alfabetizaciĂ³n.

                        PORCENTAJEANALFABETISMO POBLACIONTOTAL PORCENTAJELENGUA
PORCENTAJEANALFABETISMO                    1.00          -0.20             0.65
POBLACIONTOTAL                            -0.20           1.00            -0.12
PORCENTAJELENGUA                           0.65          -0.12             1.00
PORCENTAJENBI                              0.08          -0.29             0.04
Porcentaje Mujer                          -0.37          -0.12            -0.19
Porcentaje Hombre                          0.37           0.12             0.19
Rural porcentaje                           0.60          -0.27             0.45
Urbano porcentaje                         -0.60           0.27            -0.45
SIN WIFI                                  -0.56           0.46            -0.41
CON WIFI                                   0.56          -0.46             0.41
                        PORCENTAJENBI Porcentaje Mujer Porcentaje Hombre
PORCENTAJEANALFABETISMO          0.08            -0.37              0.37
POBLACIONTOTAL                  -0.29            -0.12              0.12
PORCENTAJELENGUA                 0.04            -0.19              0.19
PORCENTAJENBI                    1.00             0.41             -0.41
Porcentaje Mujer                 0.41             1.00             -1.00
Porcentaje Hombre               -0.41            -1.00              1.00
Rural porcentaje                 0.33             0.07             -0.07
Urbano porcentaje               -0.33            -0.07              0.07
SIN WIFI                        -0.50            -0.16              0.16
CON WIFI                         0.50             0.16             -0.16
                        Rural porcentaje Urbano porcentaje SIN WIFI CON WIFI
PORCENTAJEANALFABETISMO             0.60             -0.60    -0.56     0.56
POBLACIONTOTAL                     -0.27              0.27     0.46    -0.46
PORCENTAJELENGUA                    0.45             -0.45    -0.41     0.41
PORCENTAJENBI                       0.33             -0.33    -0.50     0.50
Porcentaje Mujer                    0.07             -0.07    -0.16     0.16
Porcentaje Hombre                  -0.07              0.07     0.16    -0.16
Rural porcentaje                    1.00             -1.00    -0.84     0.84
Urbano porcentaje                  -1.00              1.00     0.84    -0.84
SIN WIFI                           -0.84              0.84     1.00    -1.00
CON WIFI                            0.84             -0.84    -1.00     1.00