link3="https://docs.google.com/spreadsheets/d/e/2PACX-1vTHJy2XgXgjuQWteJ5xO7PA7kvdo2d08W5-8rojcyKJqp_okS-dmpHWVpNCsNzCHxwlIm_GiT24VSTn/pub?output=csv"

ap=read.csv(link3,stringsAsFactors = F)
str(ap)
## 'data.frame':    1834 obs. of  12 variables:
##  $ ubiReg    : int  10000 10000 10000 10000 10000 10000 10000 10000 10000 10000 ...
##  $ ubiProv   : int  10200 10200 10200 10200 10200 10200 10300 10300 10300 10300 ...
##  $ ubiDis    : int  10202 10201 10203 10204 10205 10206 10302 10303 10304 10305 ...
##  $ depa      : chr  "AMAZONAS" "AMAZONAS" "AMAZONAS" "AMAZONAS" ...
##  $ prov      : chr  "BAGUA" "BAGUA" "BAGUA" "BAGUA" ...
##  $ dist      : chr  "ARAMANGO" "BAGUA" "COPALLIN" "EL PARCO" ...
##  $ pobla     : int  11587 26067 6501 1443 23820 8020 349 282 922 883 ...
##  $ esperanza : num  76.8 74.7 78 77.4 77.4 ...
##  $ accesoedu : num  5.38 8.33 5.77 6.24 5.78 8.33 5.76 6.75 4.83 5.04 ...
##  $ percapitaf: num  405 662 452 551 209 ...
##  $ PPK       : int  1823 4949 1490 604 6282 2342 135 92 234 283 ...
##  $ FP        : int  3072 5809 1321 400 2059 2765 118 162 189 155 ...
summary(ap)
##      ubiReg          ubiProv           ubiDis           depa          
##  Min.   : 10000   Min.   : 10100   Min.   : 10101   Length:1834       
##  1st Qu.: 50000   1st Qu.: 50200   1st Qu.: 50205   Class :character  
##  Median :100000   Median :100450   Median :100452   Mode  :character  
##  Mean   :106390   Mean   :106929   Mean   :106937                     
##  3rd Qu.:150000   3rd Qu.:150800   3rd Qu.:150808                     
##  Max.   :250000   Max.   :250400   Max.   :250401                     
##      prov               dist               pobla           esperanza    
##  Length:1834        Length:1834        Min.   :    181   Min.   :51.72  
##  Class :character   Class :character   1st Qu.:   1915   1st Qu.:70.02  
##  Mode  :character   Mode  :character   Median :   4564   Median :73.39  
##                                        Mean   :  16432   Mean   :72.67  
##                                        3rd Qu.:  11485   3rd Qu.:76.45  
##                                        Max.   :1025929   Max.   :83.52  
##    accesoedu        percapitaf          PPK                 FP          
##  Min.   : 2.030   Min.   : 100.0   Min.   :     0.0   Min.   :     0.0  
##  1st Qu.: 5.240   1st Qu.: 201.7   1st Qu.:   378.2   1st Qu.:   413.2  
##  Median : 6.500   Median : 317.8   Median :   945.5   Median :   929.5  
##  Mean   : 6.825   Mean   : 392.4   Mean   :  4562.7   Mean   :  4529.7  
##  3rd Qu.: 8.178   3rd Qu.: 511.9   3rd Qu.:  2279.8   3rd Qu.:  2443.5  
##  Max.   :14.250   Max.   :1596.1   Max.   :264607.0   Max.   :318615.0

Preguntas:

1. PPK ganó le ganó a FP en todas las provincias?

primero debo saber la diferencia de votos entre ppk y fp

ap$dif=ap$PPK-ap$FP
head(aggregate(dif~prov,data = ap,sum),20)
##                prov    dif
## 1           ABANCAY    137
## 2          ACOBAMBA    577
## 3           ACOMAYO   4646
## 4              AIJA   -397
## 5     ALTO AMAZONAS  13871
## 6              AMBO  -2903
## 7       ANDAHUAYLAS   -513
## 8          ANGARAES   2866
## 9              ANTA   9633
## 10        ANTABAMBA    135
## 11 ANTONIO RAYMONDI   1681
## 12         AREQUIPA 274149
## 13           ASCOPE -18314
## 14         ASUNCION    330
## 15          ATALAYA  -7635
## 16          AYABACA   1627
## 17         AYMARAES  -1337
## 18         AZANGARO  29420
## 19            BAGUA   2064
## 20         BARRANCA -20134

Se ve que no en todas las provincias gano, pues hay valores en negativo

dataprov=aggregate(dif~prov,data=ap,sum)
length(dataprov[dataprov$dif>=0,'prov'])
## [1] 93

Es un 93 provincias donde no gano

2. Existe correlación entre la ventaja que le sacó PPK a FP y nivel de ingresos? Qué coeficiente usó?

shapiro.test(ap$dif)
## 
##  Shapiro-Wilk normality test
## 
## data:  ap$dif
## W = 0.46253, p-value < 2.2e-16

es NO NORNMAL uso Spearman

cor.test(ap$dif,ap$percapitaf,method = "spearman")
## Warning in cor.test.default(ap$dif, ap$percapitaf, method = "spearman"):
## Cannot compute exact p-value with ties
## 
##  Spearman's rank correlation rho
## 
## data:  ap$dif and ap$percapitaf
## S = 1112796710, p-value = 0.0004149
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##         rho 
## -0.08235373

HAY CORRELACION

Antes de responder las preguntas mejor tengo una variable de control:

names(ap)
##  [1] "ubiReg"     "ubiProv"    "ubiDis"     "depa"       "prov"      
##  [6] "dist"       "pobla"      "esperanza"  "accesoedu"  "percapitaf"
## [11] "PPK"        "FP"         "dif"
todo=lm(dif~accesoedu+percapitaf+pobla+esperanza,data = ap)
summary(todo)
## 
## Call:
## lm(formula = dif ~ accesoedu + percapitaf + pobla + esperanza, 
##     data = ap)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -36426  -1276     75   1143  74927 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  3.553e+03  1.739e+03   2.044  0.04111 *  
## accesoedu    2.640e+02  9.807e+01   2.692  0.00716 ** 
## percapitaf   5.003e+00  7.962e-01   6.283 4.13e-10 ***
## pobla       -2.494e-02  2.596e-03  -9.607  < 2e-16 ***
## esperanza   -9.462e+01  2.413e+01  -3.921 9.13e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5182 on 1829 degrees of freedom
## Multiple R-squared:  0.09786,    Adjusted R-squared:  0.09589 
## F-statistic:  49.6 on 4 and 1829 DF,  p-value: < 2.2e-16

3. Se cumple la hipotesis 1? que nos puedes informar sobre esa hipotesis?

. h1:PPK tuvo más apoyo que FP mientras mejor acceso a la educación Si se cumple la H1, tiene una significancia del 0.001 hay una relacion directa tiene un coef del 2640

4. Se cumple la hipotesis 2? que nos puedes informar sobre esa hipotesis?

. h2: PPK tuvo más apoyo que FP mientras mayor era a la esperanza de vida. No se confirma la hipotesis Tiene una relacion inversa ademas de una significancia de 0.001

5.Se cumple la hipotesis 3? que nos puedes informar sobre esa hipotesis?

. h3: PPK tuvo menos apoyo que FP mientras mayores ingresos. No se confirma la hipotesis tiene relacion directa