link="https://docs.google.com/spreadsheets/d/e/2PACX-1vTnH3qz86TjQ6j8NfVg0YH5mOn912DweP17O0qB37qT4MFIxajQb78to0qAKseX6Q/pub?output=csv"
A=read.csv("https://docs.google.com/spreadsheets/d/e/2PACX-1vTnH3qz86TjQ6j8NfVg0YH5mOn912DweP17O0qB37qT4MFIxajQb78to0qAKseX6Q/pub?output=csv",stringsAsFactors = F)
str(A)
## 'data.frame': 1834 obs. of 12 variables:
## $ ubiReg : int 10000 10000 10000 10000 10000 10000 10000 10000 10000 10000 ...
## $ ubiProv : int 10200 10200 10200 10200 10200 10200 10300 10300 10300 10300 ...
## $ ubiDis : int 10202 10201 10203 10204 10205 10206 10302 10303 10304 10305 ...
## $ depa : chr "AMAZONAS" "AMAZONAS" "AMAZONAS" "AMAZONAS" ...
## $ prov : chr "BAGUA" "BAGUA" "BAGUA" "BAGUA" ...
## $ dist : chr "ARAMANGO" "BAGUA" "COPALLIN" "EL PARCO" ...
## $ pobla : int 11587 26067 6501 1443 23820 8020 349 282 922 883 ...
## $ esperanza : num 76.8 74.7 78 77.4 77.4 ...
## $ accesoedu : num 5.38 8.33 5.77 6.24 5.78 8.33 5.76 6.75 4.83 5.04 ...
## $ percapitaf: num 405 662 452 551 209 ...
## $ PPK : int 1823 4949 1490 604 6282 2342 135 92 234 283 ...
## $ FP : int 3072 5809 1321 400 2059 2765 118 162 189 155 ...
A[,c(4,5,6)]=lapply(A[,c(4,5,6)],as.factor)
A[,c(8,9,10)]=lapply(A[,c(8,9,10)],as.numeric)
str(A)
## 'data.frame': 1834 obs. of 12 variables:
## $ ubiReg : int 10000 10000 10000 10000 10000 10000 10000 10000 10000 10000 ...
## $ ubiProv : int 10200 10200 10200 10200 10200 10200 10300 10300 10300 10300 ...
## $ ubiDis : int 10202 10201 10203 10204 10205 10206 10302 10303 10304 10305 ...
## $ depa : Factor w/ 25 levels "AMAZONAS","ANCASH",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ prov : Factor w/ 195 levels "ABANCAY","ACOBAMBA",..: 19 19 19 19 19 19 24 24 24 24 ...
## $ dist : Factor w/ 1684 levels "ABANCAY","ABELARDO PARDO LEZAMETA",..: 83 117 411 476 645 730 324 358 421 437 ...
## $ pobla : int 11587 26067 6501 1443 23820 8020 349 282 922 883 ...
## $ esperanza : num 76.8 74.7 78 77.4 77.4 ...
## $ accesoedu : num 5.38 8.33 5.77 6.24 5.78 8.33 5.76 6.75 4.83 5.04 ...
## $ percapitaf: num 405 662 452 551 209 ...
## $ PPK : int 1823 4949 1490 604 6282 2342 135 92 234 283 ...
## $ FP : int 3072 5809 1321 400 2059 2765 118 162 189 155 ...
summary(A)
## ubiReg ubiProv ubiDis depa
## Min. : 10000 Min. : 10100 Min. : 10101 LIMA : 171
## 1st Qu.: 50000 1st Qu.: 50200 1st Qu.: 50205 ANCASH : 166
## Median :100000 Median :100450 Median :100452 CAJAMARCA: 127
## Mean :106390 Mean :106929 Mean :106937 JUNIN : 123
## 3rd Qu.:150000 3rd Qu.:150800 3rd Qu.:150808 AYACUCHO : 111
## Max. :250000 Max. :250400 Max. :250401 AREQUIPA : 109
## (Other) :1027
## prov dist pobla esperanza
## LIMA : 43 SANTA ROSA : 10 Min. : 181 Min. :51.72
## JAUJA : 34 SAN ANTONIO : 5 1st Qu.: 1915 1st Qu.:70.02
## YAUYOS : 33 SANTA CRUZ : 5 Median : 4564 Median :73.39
## HUAROCHIRI: 32 BELLAVISTA : 4 Mean : 16432 Mean :72.67
## AREQUIPA : 29 INDEPENDENCIA: 4 3rd Qu.: 11485 3rd Qu.:76.45
## HUANCAYO : 28 MIRAFLORES : 4 Max. :1025929 Max. :83.52
## (Other) :1635 (Other) :1802
## accesoedu percapitaf PPK FP
## Min. : 2.030 Min. : 100.0 Min. : 0.0 Min. : 0.0
## 1st Qu.: 5.240 1st Qu.: 201.7 1st Qu.: 378.2 1st Qu.: 413.2
## Median : 6.500 Median : 317.8 Median : 945.5 Median : 929.5
## Mean : 6.825 Mean : 392.4 Mean : 4562.7 Mean : 4529.7
## 3rd Qu.: 8.178 3rd Qu.: 511.9 3rd Qu.: 2279.8 3rd Qu.: 2443.5
## Max. :14.250 Max. :1596.1 Max. :264607.0 Max. :318615.0
##
PPK tuvo más apoyo que FP mientras mejor acceso a la educación.
PPK ,EDUCACION numerico,numerico.
Ho:NO hay CORRELACIÓN entre variables
1.Graficar esta relación (escogemos que accesoedu sea la dependiente “y”)
library(ggpubr)
## Loading required package: ggplot2
## Loading required package: magrittr
p1=ggscatter(A,
x = "accesoedu", y = "PPK",
cor.coef = TRUE,
cor.method = "pearson")
p1
Es MENOR que 0.05,significativo.Se rechaza la Ho
p2=ggscatter(A,
x = "esperanza", y = "PPK",
cor.coef = TRUE,
cor.method = "pearson")
p2
eS MAYOR QUE 0.05.se acepta la hipotesis ho
p3=ggscatter(A,
x = "percapitaf", y = "PPK",
cor.coef = TRUE,
cor.method = "pearson")
p3
Es menor que 0.05, NO SIGNIFICATIVO.Se rechaza la Ho
Hipótesis del caso:En los cuatro graficos de PEARSON ,3 de 4 son MENORES QUE 0.05,SIGNIFICATIVO.En consecuencia se rehazaría la Ho(NO hay correlación entre variables). ES DECIR SÍ HAY CORRELACIÓN ENTRE LAS VARIABLES.
CORRELACIÓN:DIRECTA O INVERSA AUMENTA LA CORRELACIÓN:SI SE ACERCA A 1,o -1. SE DESVANECE LA CORRELACIÓN:Se ace4rca a 0.
all_ps=ggarrange(p1,p2,p3,
ncol = 2, nrow = 2)
annotate_figure(all_ps,
top = text_grob("Correlacion con PPK",
color = "blue",
face = "bold",
size = 14))
library(ggpubr)
p1=ggscatter(A,
x = "accesoedu", y = "FP",
cor.coef = TRUE,
cor.method = "pearson")
p1
p2=ggscatter(A,
x = "esperanza", y = "FP",
cor.coef = TRUE,
cor.method = "pearson")
p2
p3=ggscatter(A,
x = "percapitaf", y = "FP",
cor.coef = TRUE,
cor.method = "pearson")
p3
de vida. 3. PPK tuvo menos apoyo que FP mientras mayores ingresos.