link3="https://docs.google.com/spreadsheets/d/e/2PACX-1vTHJy2XgXgjuQWteJ5xO7PA7kvdo2d08W5-8rojcyKJqp_okS-dmpHWVpNCsNzCHxwlIm_GiT24VSTn/pub?output=csv"
ap=read.csv(link3,stringsAsFactors = F)
str(ap)
## 'data.frame': 1834 obs. of 12 variables:
## $ ubiReg : int 10000 10000 10000 10000 10000 10000 10000 10000 10000 10000 ...
## $ ubiProv : int 10200 10200 10200 10200 10200 10200 10300 10300 10300 10300 ...
## $ ubiDis : int 10202 10201 10203 10204 10205 10206 10302 10303 10304 10305 ...
## $ depa : chr "AMAZONAS" "AMAZONAS" "AMAZONAS" "AMAZONAS" ...
## $ prov : chr "BAGUA" "BAGUA" "BAGUA" "BAGUA" ...
## $ dist : chr "ARAMANGO" "BAGUA" "COPALLIN" "EL PARCO" ...
## $ pobla : int 11587 26067 6501 1443 23820 8020 349 282 922 883 ...
## $ esperanza : num 76.8 74.7 78 77.4 77.4 ...
## $ accesoedu : num 5.38 8.33 5.77 6.24 5.78 8.33 5.76 6.75 4.83 5.04 ...
## $ percapitaf: num 405 662 452 551 209 ...
## $ PPK : int 1823 4949 1490 604 6282 2342 135 92 234 283 ...
## $ FP : int 3072 5809 1321 400 2059 2765 118 162 189 155 ...
summary(ap)
## ubiReg ubiProv ubiDis depa
## Min. : 10000 Min. : 10100 Min. : 10101 Length:1834
## 1st Qu.: 50000 1st Qu.: 50200 1st Qu.: 50205 Class :character
## Median :100000 Median :100450 Median :100452 Mode :character
## Mean :106390 Mean :106929 Mean :106937
## 3rd Qu.:150000 3rd Qu.:150800 3rd Qu.:150808
## Max. :250000 Max. :250400 Max. :250401
## prov dist pobla esperanza
## Length:1834 Length:1834 Min. : 181 Min. :51.72
## Class :character Class :character 1st Qu.: 1915 1st Qu.:70.02
## Mode :character Mode :character Median : 4564 Median :73.39
## Mean : 16432 Mean :72.67
## 3rd Qu.: 11485 3rd Qu.:76.45
## Max. :1025929 Max. :83.52
## accesoedu percapitaf PPK FP
## Min. : 2.030 Min. : 100.0 Min. : 0.0 Min. : 0.0
## 1st Qu.: 5.240 1st Qu.: 201.7 1st Qu.: 378.2 1st Qu.: 413.2
## Median : 6.500 Median : 317.8 Median : 945.5 Median : 929.5
## Mean : 6.825 Mean : 392.4 Mean : 4562.7 Mean : 4529.7
## 3rd Qu.: 8.178 3rd Qu.: 511.9 3rd Qu.: 2279.8 3rd Qu.: 2443.5
## Max. :14.250 Max. :1596.1 Max. :264607.0 Max. :318615.0
primero debo saber la diferencia de votos entre ppk y fp
ap$dif=ap$PPK-ap$FP
head(aggregate(dif~prov,data = ap,sum),20)
## prov dif
## 1 ABANCAY 137
## 2 ACOBAMBA 577
## 3 ACOMAYO 4646
## 4 AIJA -397
## 5 ALTO AMAZONAS 13871
## 6 AMBO -2903
## 7 ANDAHUAYLAS -513
## 8 ANGARAES 2866
## 9 ANTA 9633
## 10 ANTABAMBA 135
## 11 ANTONIO RAYMONDI 1681
## 12 AREQUIPA 274149
## 13 ASCOPE -18314
## 14 ASUNCION 330
## 15 ATALAYA -7635
## 16 AYABACA 1627
## 17 AYMARAES -1337
## 18 AZANGARO 29420
## 19 BAGUA 2064
## 20 BARRANCA -20134
Se ve que no en todas las provincias gano, pues hay valores en negativo
dataprov=aggregate(dif~prov,data=ap,sum)
length(dataprov[dataprov$dif>=0,'prov'])
## [1] 93
Es un 93 provincias donde no gano
shapiro.test(ap$dif)
##
## Shapiro-Wilk normality test
##
## data: ap$dif
## W = 0.46253, p-value < 2.2e-16
es NO NORNMAL uso Spearman
cor.test(ap$dif,ap$percapitaf,method = "spearman")
## Warning in cor.test.default(ap$dif, ap$percapitaf, method = "spearman"):
## Cannot compute exact p-value with ties
##
## Spearman's rank correlation rho
##
## data: ap$dif and ap$percapitaf
## S = 1112796710, p-value = 0.0004149
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## -0.08235373
HAY CORRELACION
Antes de responder las preguntas mejor tengo una variable de control:
names(ap)
## [1] "ubiReg" "ubiProv" "ubiDis" "depa" "prov"
## [6] "dist" "pobla" "esperanza" "accesoedu" "percapitaf"
## [11] "PPK" "FP" "dif"
todo=lm(dif~accesoedu+percapitaf+pobla+esperanza,data = ap)
summary(todo)
##
## Call:
## lm(formula = dif ~ accesoedu + percapitaf + pobla + esperanza,
## data = ap)
##
## Residuals:
## Min 1Q Median 3Q Max
## -36426 -1276 75 1143 74927
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.553e+03 1.739e+03 2.044 0.04111 *
## accesoedu 2.640e+02 9.807e+01 2.692 0.00716 **
## percapitaf 5.003e+00 7.962e-01 6.283 4.13e-10 ***
## pobla -2.494e-02 2.596e-03 -9.607 < 2e-16 ***
## esperanza -9.462e+01 2.413e+01 -3.921 9.13e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5182 on 1829 degrees of freedom
## Multiple R-squared: 0.09786, Adjusted R-squared: 0.09589
## F-statistic: 49.6 on 4 and 1829 DF, p-value: < 2.2e-16
. h1:PPK tuvo más apoyo que FP mientras mejor acceso a la educación Si se cumple la H1, tiene una significancia del 0.001 hay una relacion directa tiene un coef del 2640
. h2: PPK tuvo más apoyo que FP mientras mayor era a la esperanza de vida. No se confirma la hipotesis Tiene una relacion inversa ademas de una significancia de 0.001
. h3: PPK tuvo menos apoyo que FP mientras mayores ingresos. No se confirma la hipotesis tiene relacion directa