DESARROLLO DE PREGUNTA

Importamos la data

library(rio)
data = import("dataPeru.xlsx")

##Variables a tratar:

Pregunta 1 - el buen estado de los locales escolares depende del porcentaje de la poblacion que contribuye a la SUNAT; y del porcentaje de la PEA que está laborando; se llega a comprobar que (con una significancia del 0.05):

Primero: sacar el porcentaje de la poblaci[on que contribuye a la SUNAT

data$SUNAT_porc = data$contribuyentesSunat/data$pobTotal
data$PEAOC_porc = data$peaOcupada/data$pobTotal

##REGRESI[ON LINEAL]

modelo_rl = lm(buenEstado ~ SUNAT_porc + PEAOC_porc, data = data)
summary(modelo_rl)
## 
## Call:
## lm(formula = buenEstado ~ SUNAT_porc + PEAOC_porc, data = data)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -10.0928  -4.3610   0.2575   4.4003  11.0196 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)
## (Intercept)   -22.61      15.96  -1.416    0.171
## SUNAT_porc     10.03      31.21   0.321    0.751
## PEAOC_porc    102.18      64.24   1.590    0.126
## 
## Residual standard error: 6.299 on 22 degrees of freedom
## Multiple R-squared:  0.4669, Adjusted R-squared:  0.4184 
## F-statistic: 9.633 on 2 and 22 DF,  p-value: 0.000989

Pregunta 2: Al querer probar la hipotesis que la cantidad de PEA ocupada dependen de la cantidad de contribuyentes a la SUNAT ; y del porcentaje de locales escolares en buen estado; se llega a comprobar que (con una significancia del 0.05):

modelo_rl2 = lm(peaOcupada ~ contribuyentesSunat + buenEstado, data = data)
summary(modelo_rl2)
## 
## Call:
## lm(formula = peaOcupada ~ contribuyentesSunat + buenEstado, data = data)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -91867 -58573 -11166  46174 155851 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          1.155e+05  3.787e+04   3.049  0.00588 ** 
## contribuyentesSunat  9.206e-01  1.741e-02  52.872  < 2e-16 ***
## buenEstado          -1.412e+03  1.983e+03  -0.712  0.48395    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 74540 on 22 degrees of freedom
## Multiple R-squared:  0.9932, Adjusted R-squared:  0.9926 
## F-statistic:  1603 on 2 and 22 DF,  p-value: < 2.2e-16