DESARROLLO DE PREGUNTA
Importamos la data
library(rio)
data = import("dataPeru.xlsx")
##Variables a tratar:
Pregunta 1 - el buen estado de los locales escolares depende del porcentaje de la poblacion que contribuye a la SUNAT; y del porcentaje de la PEA que está laborando; se llega a comprobar que (con una significancia del 0.05):
Primero: sacar el porcentaje de la poblaci[on que contribuye a la SUNAT
data$SUNAT_porc = data$contribuyentesSunat/data$pobTotal
data$PEAOC_porc = data$peaOcupada/data$pobTotal
##REGRESI[ON LINEAL]
modelo_rl = lm(buenEstado ~ SUNAT_porc + PEAOC_porc, data = data)
summary(modelo_rl)
##
## Call:
## lm(formula = buenEstado ~ SUNAT_porc + PEAOC_porc, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -10.0928 -4.3610 0.2575 4.4003 11.0196
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -22.61 15.96 -1.416 0.171
## SUNAT_porc 10.03 31.21 0.321 0.751
## PEAOC_porc 102.18 64.24 1.590 0.126
##
## Residual standard error: 6.299 on 22 degrees of freedom
## Multiple R-squared: 0.4669, Adjusted R-squared: 0.4184
## F-statistic: 9.633 on 2 and 22 DF, p-value: 0.000989
Pregunta 2: Al querer probar la hipotesis que la cantidad de PEA ocupada dependen de la cantidad de contribuyentes a la SUNAT ; y del porcentaje de locales escolares en buen estado; se llega a comprobar que (con una significancia del 0.05):
modelo_rl2 = lm(peaOcupada ~ contribuyentesSunat + buenEstado, data = data)
summary(modelo_rl2)
##
## Call:
## lm(formula = peaOcupada ~ contribuyentesSunat + buenEstado, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -91867 -58573 -11166 46174 155851
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.155e+05 3.787e+04 3.049 0.00588 **
## contribuyentesSunat 9.206e-01 1.741e-02 52.872 < 2e-16 ***
## buenEstado -1.412e+03 1.983e+03 -0.712 0.48395
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 74540 on 22 degrees of freedom
## Multiple R-squared: 0.9932, Adjusted R-squared: 0.9926
## F-statistic: 1603 on 2 and 22 DF, p-value: < 2.2e-16