Examen parcial

library(rio)
dataexam=import("dataPeru.xlsx")

“DEPARTAMENTO” : Departamento del Peru

“UBIGEO”: Ubigeo del departamento

“buenEstado”: Porcentaje de locales escolares en buen estado

“contribuyentesSunat”: Cantidad de contribuyentes a la SUNAT (PEA)

“peaOcupada”: Cantidad de PEA ocupada

“pobUrbana”: poblacion urbana (PEA)

“PobRural”: poblacion rural (PEA)

“pobTotal” Poblacion total (PEA)

head(dataexam)

##   DEPARTAMENTO UBIGEO buenEstado contribuyentesSunat peaOcupada pobUrbana
## 1     AMAZONAS 010000       18.6               75035     130019    205976
## 2       ÁNCASH 020000       13.9              302906     387976    806065
## 3     APURÍMAC 030000        8.7              103981     140341    243354
## 4     AREQUIPA 040000       27.4              585628     645001   1383694
## 5     AYACUCHO 050000       17.0              151191     235857    444473
## 6    CAJAMARCA 060000       18.0              277457     461312    567141
##   PobRural pobTotal
## 1   211389   417365
## 2   333050  1139115
## 3   180905   424259
## 4    76739  1460433
## 5   206467   650940
## 6   860386  1427527

Pregunta 1:

str(dataexam$buenEstado)

##  num [1:25] 18.6 13.9 8.7 27.4 17 18 33.8 11.9 10.1 15.6 ...

str(dataexam$contribuyentesSunat)

##  num [1:25] 75035 302906 103981 585628 151191 ...

str(dataexam$peaOcupada)

##  num [1:25] 130019 387976 140341 645001 235857 ...

Los locales escolares en buen estado (buenEstado) dependen del porcentaje de la población que contribuye a la SUNAT (contribuyentesSunat) Porcentaje de la PEA que está laborando (peaOcupada)

Con una significancia de 0.05

modelo1=lm(dataexam$buenEstado~dataexam$contribuyentesSunat+dataexam$peaOcupada)
summary(modelo1)

## 
## Call:
## lm(formula = dataexam$buenEstado ~ dataexam$contribuyentesSunat + 
##     dataexam$peaOcupada)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -10.589  -3.966  -1.347   1.907  21.518 
## 
## Coefficients:
##                                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                   1.865e+01  2.694e+00   6.922 5.98e-07 ***
## dataexam$contribuyentesSunat  1.786e-05  2.060e-05   0.867    0.395    
## dataexam$peaOcupada          -1.596e-05  2.241e-05  -0.712    0.484    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.925 on 22 degrees of freedom
## Multiple R-squared:  0.1561, Adjusted R-squared:  0.07939 
## F-statistic: 2.035 on 2 and 22 DF,  p-value: 0.1546

Pregunta 2: Cantidad de peaOcupada dependen de la cantidad de contribuyentes a la SUNAT (contribuyentesSunat) y el porcentaje de locales escolares en buen estado (buenEstado). Con una significancia del 0.05

modelo2=lm(dataexam$peaOcupada~dataexam$contribuyentesSunat+dataexam$buenEstado)
summary(modelo2)

## 
## Call:
## lm(formula = dataexam$peaOcupada ~ dataexam$contribuyentesSunat + 
##     dataexam$buenEstado)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -91867 -58573 -11166  46174 155851 
## 
## Coefficients:
##                                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                   1.155e+05  3.787e+04   3.049  0.00588 ** 
## dataexam$contribuyentesSunat  9.206e-01  1.741e-02  52.872  < 2e-16 ***
## dataexam$buenEstado          -1.412e+03  1.983e+03  -0.712  0.48395    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 74540 on 22 degrees of freedom
## Multiple R-squared:  0.9932, Adjusted R-squared:  0.9926 
## F-statistic:  1603 on 2 and 22 DF,  p-value: < 2.2e-16

PARTE 2 La cantidad de Residuos no dominiliarios (QRESIDUOS_NO_DOM) y la Tasa de denuncias puede explicar el porcentaje de votos distrital de Renovación Popular:

1.Resultados por distrito (Lima Metropolitana)

library(rvest)
link = "https://es.wikipedia.org/wiki/Elecciones_municipales_de_Lima_de_2022"
path = '//*[@id="mw-content-text"]/div[1]/table[9]'
dataelec <- read_html(link)%>%html_nodes(xpath = path)%>%html_table()%>% .[[1]]
head(dataelec)

## # A tibble: 6 × 17
##   Distrito RP       RP     PP    PP    SP    SP    FE    FE    APP   APP   JP   
##   <chr>    <chr>    <chr>  <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 Distrito ""       ""     ""    ""    ""    ""    ""    ""    ""    ""    ""   
## 2 Distrito "V"      "%"    "V"   "%"   "V"   "%"   "V"   "%"   "V"   "%"   "V"  
## 3 Ancón    "3,725"  "13.2… "9,3… "33.… "5,9… "21.… "2,0… "7.2… "3,5… "12.… "1,6…
## 4 Ate      "57,374" "17.4… "98,… "29.… "52,… "15.… "27,… "8.5… "26,… "7.9… "25,…
## 5 Barranco "11,604" "36.9… "5,7… "18.… "6,4… "20.… "2,7… "8.8… "2,1… "6.9… "1,6…
## 6 Breña    "22,721" "31.1… "18,… "25.… "14,… "19.… "8,2… "11.… "2,4… "3.3… "3,8…
## # ℹ 5 more variables: JP <chr>, AvP <chr>, AvP <chr>, PL <chr>, PL <chr>

library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

colnames(dataelec)[2]="Renovacion popular"
colnames(dataelec)[3]= "Podemos Peru"
  colnames(dataelec)[4]= "Somos Peru"
  colnames(dataelec)[5]= "Frente de la Esperanza"
  colnames(dataelec)[6]= "Alianza para el Progreso"
  colnames(dataelec)[7]= "Juntos por el Peru"
  colnames(dataelec)[8]= "Avanza Pais"
  colnames(dataelec)[9]= "Peru Libre"

Examen parcial

Ana Gutierrez Montufar

2024-05-15