library(rio)
dataexam=import("dataPeru.xlsx")
“DEPARTAMENTO” : Departamento del Peru
“UBIGEO”: Ubigeo del departamento
“buenEstado”: Porcentaje de locales escolares en buen estado
“contribuyentesSunat”: Cantidad de contribuyentes a la SUNAT (PEA)
“peaOcupada”: Cantidad de PEA ocupada
“pobUrbana”: poblacion urbana (PEA)
“PobRural”: poblacion rural (PEA)
“pobTotal” Poblacion total (PEA)
head(dataexam)
## DEPARTAMENTO UBIGEO buenEstado contribuyentesSunat peaOcupada pobUrbana
## 1 AMAZONAS 010000 18.6 75035 130019 205976
## 2 ÁNCASH 020000 13.9 302906 387976 806065
## 3 APURÍMAC 030000 8.7 103981 140341 243354
## 4 AREQUIPA 040000 27.4 585628 645001 1383694
## 5 AYACUCHO 050000 17.0 151191 235857 444473
## 6 CAJAMARCA 060000 18.0 277457 461312 567141
## PobRural pobTotal
## 1 211389 417365
## 2 333050 1139115
## 3 180905 424259
## 4 76739 1460433
## 5 206467 650940
## 6 860386 1427527
Pregunta 1:
str(dataexam$buenEstado)
## num [1:25] 18.6 13.9 8.7 27.4 17 18 33.8 11.9 10.1 15.6 ...
str(dataexam$contribuyentesSunat)
## num [1:25] 75035 302906 103981 585628 151191 ...
str(dataexam$peaOcupada)
## num [1:25] 130019 387976 140341 645001 235857 ...
Los locales escolares en buen estado (buenEstado) dependen del porcentaje de la población que contribuye a la SUNAT (contribuyentesSunat) Porcentaje de la PEA que está laborando (peaOcupada)
Con una significancia de 0.05
modelo1=lm(dataexam$buenEstado~dataexam$contribuyentesSunat+dataexam$peaOcupada)
summary(modelo1)
##
## Call:
## lm(formula = dataexam$buenEstado ~ dataexam$contribuyentesSunat +
## dataexam$peaOcupada)
##
## Residuals:
## Min 1Q Median 3Q Max
## -10.589 -3.966 -1.347 1.907 21.518
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.865e+01 2.694e+00 6.922 5.98e-07 ***
## dataexam$contribuyentesSunat 1.786e-05 2.060e-05 0.867 0.395
## dataexam$peaOcupada -1.596e-05 2.241e-05 -0.712 0.484
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 7.925 on 22 degrees of freedom
## Multiple R-squared: 0.1561, Adjusted R-squared: 0.07939
## F-statistic: 2.035 on 2 and 22 DF, p-value: 0.1546
Pregunta 2: Cantidad de peaOcupada dependen de la cantidad de contribuyentes a la SUNAT (contribuyentesSunat) y el porcentaje de locales escolares en buen estado (buenEstado). Con una significancia del 0.05
modelo2=lm(dataexam$peaOcupada~dataexam$contribuyentesSunat+dataexam$buenEstado)
summary(modelo2)
##
## Call:
## lm(formula = dataexam$peaOcupada ~ dataexam$contribuyentesSunat +
## dataexam$buenEstado)
##
## Residuals:
## Min 1Q Median 3Q Max
## -91867 -58573 -11166 46174 155851
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.155e+05 3.787e+04 3.049 0.00588 **
## dataexam$contribuyentesSunat 9.206e-01 1.741e-02 52.872 < 2e-16 ***
## dataexam$buenEstado -1.412e+03 1.983e+03 -0.712 0.48395
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 74540 on 22 degrees of freedom
## Multiple R-squared: 0.9932, Adjusted R-squared: 0.9926
## F-statistic: 1603 on 2 and 22 DF, p-value: < 2.2e-16
PARTE 2 La cantidad de Residuos no dominiliarios (QRESIDUOS_NO_DOM) y la Tasa de denuncias puede explicar el porcentaje de votos distrital de Renovación Popular:
1.Resultados por distrito (Lima Metropolitana)
library(rvest)
link = "https://es.wikipedia.org/wiki/Elecciones_municipales_de_Lima_de_2022"
path = '//*[@id="mw-content-text"]/div[1]/table[9]'
dataelec <- read_html(link)%>%html_nodes(xpath = path)%>%html_table()%>% .[[1]]
head(dataelec)
## # A tibble: 6 × 17
## Distrito RP RP PP PP SP SP FE FE APP APP JP
## <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 Distrito "" "" "" "" "" "" "" "" "" "" ""
## 2 Distrito "V" "%" "V" "%" "V" "%" "V" "%" "V" "%" "V"
## 3 Ancón "3,725" "13.2… "9,3… "33.… "5,9… "21.… "2,0… "7.2… "3,5… "12.… "1,6…
## 4 Ate "57,374" "17.4… "98,… "29.… "52,… "15.… "27,… "8.5… "26,… "7.9… "25,…
## 5 Barranco "11,604" "36.9… "5,7… "18.… "6,4… "20.… "2,7… "8.8… "2,1… "6.9… "1,6…
## 6 Breña "22,721" "31.1… "18,… "25.… "14,… "19.… "8,2… "11.… "2,4… "3.3… "3,8…
## # ℹ 5 more variables: JP <chr>, AvP <chr>, AvP <chr>, PL <chr>, PL <chr>
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
colnames(dataelec)[2]="Renovacion popular"
colnames(dataelec)[3]= "Podemos Peru"
colnames(dataelec)[4]= "Somos Peru"
colnames(dataelec)[5]= "Frente de la Esperanza"
colnames(dataelec)[6]= "Alianza para el Progreso"
colnames(dataelec)[7]= "Juntos por el Peru"
colnames(dataelec)[8]= "Avanza Pais"
colnames(dataelec)[9]= "Peru Libre"