Examen Parcial PREGUNTA 1 y 2

library(rio)
dataPeru= import("C:/Users/Windows 10/Downloads/dataPeru.xlsx")

“DEPARTAMENTO” : Departamento del Peru “UBIGEO”: Ubigeo del departamento “buenEstado”: Porcentaje de locales escolares en buen estado “contribuyentesSunat”: Cantidad de contribuyentes a la SUNAT (PEA) “peaOcupada”: Cantidad de PEA ocupada “pobUrbana”: poblacion urbana (PEA) “PobRural”: poblacion rural (PEA) “pobTotal” Poblacion total (PEA

str(dataPeru)
## 'data.frame':    25 obs. of  8 variables:
##  $ DEPARTAMENTO       : chr  "AMAZONAS" "ÁNCASH" "APURÍMAC" "AREQUIPA" ...
##  $ UBIGEO             : chr  "010000" "020000" "030000" "040000" ...
##  $ buenEstado         : num  18.6 13.9 8.7 27.4 17 18 33.8 11.9 10.1 15.6 ...
##  $ contribuyentesSunat: num  75035 302906 103981 585628 151191 ...
##  $ peaOcupada         : num  130019 387976 140341 645001 235857 ...
##  $ pobUrbana          : num  205976 806065 243354 1383694 444473 ...
##  $ PobRural           : num  211389 333050 180905 76739 206467 ...
##  $ pobTotal           : num  417365 1139115 424259 1460433 650940 ...

Al querer probar la hipotesis que los locales escolares en buen estado dependen del porcentaje de la poblacion que contribuye a la SUNAT; y del porcentaje de la PEA que está laborando; se llega a comprobar que (con una significancia del 0.05):

 # hipotesis en R
modelo1=formula(buenEstado~ contribuyentesSunat+peaOcupada)
reg1=lm(modelo1,data=dataPeru)
summary(reg1)
## 
## Call:
## lm(formula = modelo1, data = dataPeru)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -10.589  -3.966  -1.347   1.907  21.518 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          1.865e+01  2.694e+00   6.922 5.98e-07 ***
## contribuyentesSunat  1.786e-05  2.060e-05   0.867    0.395    
## peaOcupada          -1.596e-05  2.241e-05  -0.712    0.484    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.925 on 22 degrees of freedom
## Multiple R-squared:  0.1561, Adjusted R-squared:  0.07939 
## F-statistic: 2.035 on 2 and 22 DF,  p-value: 0.1546
library(modelsummary)
## `modelsummary` 2.0.0 now uses `tinytable` as its default table-drawing
##   backend. Learn more at: https://vincentarelbundock.github.io/tinytable/
## 
## Revert to `kableExtra` for one session:
## 
##   options(modelsummary_factory_default = 'kableExtra')
## 
## Change the default backend persistently:
## 
##   config_modelsummary(factory_default = 'gt')
## 
## Silence this message forever:
## 
##   config_modelsummary(startup_message = FALSE)
model1=list('Buen estado (I)'=reg1)
modelsummary(model1, title = "Regresion: modelo 1",
             stars = TRUE,
             output = "kableExtra")
Regresion: modelo 1
 Buen estado (I)
(Intercept) 18.646***
(2.694)
contribuyentesSunat 0.000
(0.000)
peaOcupada 0.000
(0.000)
Num.Obs. 25
R2 0.156
R2 Adj. 0.079
AIC 179.3
BIC 184.1
Log.Lik. -85.626
F 2.035
RMSE 7.43
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001

Al querer probar la hipotesis que la cantidad de PEA ocupada dependen de la cantidad de contribuyentes a la SUNAT ; y del porcentaje de locales escolares en buen estado; se llega a comprobar que (con una significancia del 0.05):

modelo2=formula(peaOcupada~contribuyentesSunat+buenEstado)
reg2=lm(modelo2,data=dataPeru)
summary(reg2)
## 
## Call:
## lm(formula = modelo2, data = dataPeru)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -91867 -58573 -11166  46174 155851 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          1.155e+05  3.787e+04   3.049  0.00588 ** 
## contribuyentesSunat  9.206e-01  1.741e-02  52.872  < 2e-16 ***
## buenEstado          -1.412e+03  1.983e+03  -0.712  0.48395    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 74540 on 22 degrees of freedom
## Multiple R-squared:  0.9932, Adjusted R-squared:  0.9926 
## F-statistic:  1603 on 2 and 22 DF,  p-value: < 2.2e-16
library(modelsummary)
model2=list('Peocupados (II)'=reg2)
modelsummary(model2, title = "Regresion: modelo 2",
             stars = TRUE,
             output = "kableExtra")
Regresion: modelo 2
 Peocupados (II)
(Intercept) 115468.390**
(37869.931)
contribuyentesSunat 0.921***
(0.017)
buenEstado -1411.649
(1982.682)
Num.Obs. 25
R2 0.993
R2 Adj. 0.993
AIC 636.7
BIC 641.6
Log.Lik. -314.354
F 1603.130
RMSE 69927.80
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001