library(htmltab)
linkPage="https://es.wikipedia.org/wiki/%C3%8Dndice_global_de_felicidad"
linkTabla="///div/table"
corrupcion=htmltab(doc=linkPage, which=linkTabla)
names(corrupcion)
## [1] "№"
## [2] "País"
## [3] "Puntuación"
## [4] "PIB per cápita"
## [5] "Apoyo social"
## [6] "Esperanza de años de vida saludable"
## [7] "Libertad para tomar decisiones vitales"
## [8] "Generosidad"
## [9] "Percepción de la corrupción"
library(stringr)
names(corrupcion)=str_split(names(corrupcion)," ",simplify = T)[,1]
str(corrupcion)
## 'data.frame': 156 obs. of 9 variables:
## $ № : chr "1" "2" "3" "4" ...
## $ País : chr "Finlandia" "Colombia" "Noruega" "Dinamarca" ...
## $ Puntuación : chr "7.633" "7.594" "7.560" "7.555" ...
## $ PIB : chr "1.305" "1.456" "1.372" "1.351" ...
## $ Apoyo : chr "1.592" "1.582" "1.595" "1.590" ...
## $ Esperanza : chr "0.874" "0.873" "0.870" "0.868" ...
## $ Libertad : chr "0.681" "0.686" "0.685" "0.683" ...
## $ Generosidad: chr "0.192" "0.286" "0.285" "0.284" ...
## $ Percepción : chr "0.393" "0.130" "0.410" "0.408" ...
library(readr)
corrupcion[,c(1,3:9)]=lapply(corrupcion[,c(1,3:9)],parse_number)
str(corrupcion)
## 'data.frame': 156 obs. of 9 variables:
## $ № : num 1 2 3 4 5 6 7 8 9 10 ...
## $ País : chr "Finlandia" "Colombia" "Noruega" "Dinamarca" ...
## $ Puntuación : num 7.63 7.59 7.56 7.55 7.5 ...
## $ PIB : num 1.3 1.46 1.37 1.35 1.34 ...
## $ Apoyo : num 1.59 1.58 1.59 1.59 1.64 ...
## $ Esperanza : num 0.874 0.873 0.87 0.868 0.914 0.927 0.878 0.896 0.876 0.913 ...
## $ Libertad : num 0.681 0.686 0.685 0.683 0.677 0.66 0.638 0.653 0.669 0.659 ...
## $ Generosidad: num 0.192 0.286 0.285 0.284 0.353 0.256 0.333 0.321 0.365 0.285 ...
## $ Percepción : num 0.393 0.13 0.41 0.408 0.138 0.357 0.295 0.291 0.389 0.383 ...
Analizo la dependiente
NORMALIDAD: SHAPIRO WILK
shapiro.test(corrupcion$Percepción)
##
## Shapiro-Wilk normality test
##
## data: corrupcion$Percepción
## W = 0.81431, p-value = 8.486e-13
Veo que no hay normalidad.
ASIMETRÍA Y ATÍPICOS:
library(DescTools) # instalar antes
Skew(corrupcion$Percepción)
## [1] 1.671663
La cola de atípicos va a la derecha
-Luego sabré si usar paramétrica o no paramétrica al compararla con las independientes
HISTOGRAMA:
library(ggplot2)
base=ggplot(data=corrupcion, aes(x=Percepción))
base+geom_histogram(bins=20) #usar 20 siempre
Efectivamente, asimetría positivia.
BOXPLOT
base=ggplot(data=corrupcion, aes(y=Percepción))
base+geom_boxplot() + coord_flip()
Analisis bivariado
CORRUPCION-GENEROSIDAD (NUM NUM)
f1=formula(~ Percepción + Generosidad)
library(dlookr)
## Loading required package: mice
## Loading required package: lattice
##
## Attaching package: 'mice'
## The following objects are masked from 'package:base':
##
## cbind, rbind
## Registered S3 method overwritten by 'xts':
## method from
## as.zoo.xts zoo
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
## Registered S3 method overwritten by 'gdata':
## method from
## reorder.factor DescTools
## Registered S3 methods overwritten by 'car':
## method from
## influence.merMod lme4
## cooks.distance.influence.merMod lme4
## dfbeta.influence.merMod lme4
## dfbetas.influence.merMod lme4
## Warning in fun(libname, pkgname): couldn't connect to display ":0"
##
## Attaching package: 'dlookr'
## The following object is masked from 'package:base':
##
## transform
normality(corrupcion[,c(9,8)])
## Warning: `cols` is now required.
## Please use `cols = c(statistic)`
## # A tibble: 2 x 4
## vars statistic p_value sample
## <chr> <dbl> <dbl> <dbl>
## 1 Percepción 0.814 8.49e-13 156
## 2 Generosidad 0.960 1.79e- 4 156
cor.test(f1,data=corrupcion,method = "spearm",exact=F)
##
## Spearman's rank correlation rho
##
## data: Percepción and Generosidad
## S = 446261, p-value = 0.0001883
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.2946834
library(ggpubr)
## Loading required package: magrittr
f1=ggscatter(corrupcion, x = "Generosidad", y = "Corrupcion", cor.coef = TRUE, cor.method = "spearman",
add = "reg.line", add.params = list(color = "blue", fill = "lightgray"), conf.int = TRUE)
El p-value es significativo, por lo tanto, rechazo la hipótesis. HAY CORRELACION ENTRE LAS VARIABLES
PERCEPCION-APOYOSOCIAL
f2=formula(~ Percepción + Apoyo)
library(dlookr)
normality(corrupcion[,c(9,5)])
## Warning: `cols` is now required.
## Please use `cols = c(statistic)`
## # A tibble: 2 x 4
## vars statistic p_value sample
## <chr> <dbl> <dbl> <dbl>
## 1 Percepción 0.814 8.49e-13 156
## 2 Apoyo 0.917 8.71e- 8 156
cor.test(f2,data=corrupcion,method = "spearm",exact=F)
##
## Spearman's rank correlation rho
##
## data: Percepción and Apoyo
## S = 533248, p-value = 0.05001
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.1571998
library(ggpubr)
f2=ggscatter(corrupcion, x = "Generosidad", y = "Corrupcion", cor.coef = TRUE, cor.method = "spearman",
add = "reg.line", add.params = list(color = "blue", fill = "lightgray"), conf.int = TRUE)
No es significativo, se comprueba la hipótesis: no hay relación entre las variables.
PERCEPCION-ESPERANZA
f3=formula(~ Percepción + Esperanza)
library(dlookr)
normality(corrupcion[,c(9,6)])
## Warning: `cols` is now required.
## Please use `cols = c(statistic)`
## # A tibble: 2 x 4
## vars statistic p_value sample
## <chr> <dbl> <dbl> <dbl>
## 1 Percepción 0.814 8.49e-13 156
## 2 Esperanza 0.954 5.15e- 5 156
cor.test(f3,data=corrupcion,method = "spearm",exact=F)
##
## Spearman's rank correlation rho
##
## data: Percepción and Esperanza
## S = 497598, p-value = 0.007436
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.2135453
library(ggpubr)
f3=ggscatter(corrupcion, x = "Generosidad", y = "Corrupcion", cor.coef = TRUE, cor.method = "spearman",
add = "reg.line", add.params = list(color = "blue", fill = "lightgray"), conf.int = TRUE)
Es significativo, por lo tanto, se rechaza la hipotesis. SI HAY CORRELACIÓN ENTRE LAS VARIABLES.
PERCEPCION - PIB
f4=formula(~ Percepción + PIB)
library(dlookr)
normality(corrupcion[,c(9,4)])
## Warning: `cols` is now required.
## Please use `cols = c(statistic)`
## # A tibble: 2 x 4
## vars statistic p_value sample
## <chr> <dbl> <dbl> <dbl>
## 1 Percepción 0.814 8.49e-13 156
## 2 PIB 0.977 1.18e- 2 156
cor.test(f4,data=corrupcion,method = "spearm",exact=F)
##
## Spearman's rank correlation rho
##
## data: Percepción and PIB
## S = 478238, p-value = 0.00213
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.244144
library(ggpubr)
f4=ggscatter(corrupcion, x = "Generosidad", y = "Corrupcion", cor.coef = TRUE, cor.method = "spearman",
add = "reg.line", add.params = list(color = "blue", fill = "lightgray"), conf.int = TRUE)
Es significativo: sí correlación entre las hipótesis.
ALFIN=lm(Percepción~Generosidad+Apoyo+Esperanza+PIB,data=corrupcion)
summary(ALFIN)
##
## Call:
## lm(formula = Percepción ~ Generosidad + Apoyo + Esperanza +
## PIB, data = corrupcion)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.19572 -0.05740 -0.00856 0.03661 0.36006
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -0.022364 0.031306 -0.714 0.476
## Generosidad 0.349680 0.070670 4.948 1.98e-06 ***
## Apoyo -0.004541 0.032131 -0.141 0.888
## Esperanza 0.066199 0.054222 1.221 0.224
## PIB 0.042050 0.034452 1.221 0.224
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.08655 on 151 degrees of freedom
## Multiple R-squared: 0.2282, Adjusted R-squared: 0.2077
## F-statistic: 11.16 on 4 and 151 DF, p-value: 5.862e-08
NORMALIDAD: SHAPIRO WILK
shapiro.test(corrupcion$Esperanza)
##
## Shapiro-Wilk normality test
##
## data: corrupcion$Esperanza
## W = 0.95408, p-value = 5.151e-05
ASIMETRÍA Y ATÍPICOS:
library(DescTools) # instalar antes
Skew(corrupcion$Esperanza)
## [1] -0.5189681
ALFIN2=lm(Esperanza~Generosidad+Apoyo+Esperanza+PIB+Percepción,data=corrupcion)
## Warning in model.matrix.default(mt, mf, contrasts): the response appeared
## on the right-hand side and was dropped
## Warning in model.matrix.default(mt, mf, contrasts): problem with term 3 in
## model.matrix: no columns are assigned
summary(ALFIN2)
##
## Call:
## lm(formula = Esperanza ~ Generosidad + Apoyo + Esperanza + PIB +
## Percepción, data = corrupcion)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.44146 -0.06596 0.01314 0.08111 0.25236
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.001894 0.046834 0.040 0.96780
## Generosidad 0.011424 0.113777 0.100 0.92015
## Apoyo 0.147817 0.046458 3.182 0.00178 **
## PIB 0.446014 0.036827 12.111 < 2e-16 ***
## Percepción 0.147657 0.120943 1.221 0.22403
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.1293 on 151 degrees of freedom
## Multiple R-squared: 0.7366, Adjusted R-squared: 0.7297
## F-statistic: 105.6 on 4 and 151 DF, p-value: < 2.2e-16
#eldíademisuerte
link="https://docs.google.com/spreadsheets/d/e/2PACX-1vRUGflbewVnSJRVcdJlyyQlCOwjrG00LwlFcyX2GCi1Jv7BLr4oBkBJIX9NemMVZuvbgOYKYGbhFd_R/pub?gid=1465619154&single=true&output=csv"
Para entregarle datos al objeto uso la función read.csv
datos=read.csv(link, stringsAsFactors = F,na.strings = "")
datos
## regionUbigeo provinciaUbigeo PROVINCIA IDE identidad
## 1 10000 10100 CHACHAPOYAS 0,7737 98,6179
## 2 10000 10200 BAGUA 0,6623 94,6079
## 3 10000 10300 BONGARA 0,6318 97,4681
## 4 10000 10400 CONDORCANQUI 0,4598 86,232
## 5 10000 10500 LUYA 0,6047 96,1927
## 6 10000 10600 RODRIGUEZ DE MENDOZA 0,6312 97,3431
## 7 10000 10700 UTCUBAMBA 0,6097 95,1745
## 8 20000 20100 HUARAZ 0,8119 98,5073
## 9 20000 20200 AIJA 0,6579 98,2344
## 10 20000 20300 ANTONIO RAYMONDI 0,6113 96,8158
## 11 20000 20400 ASUNCION 0,6975 97,1484
## 12 20000 20500 BOLOGNESI 0,6757 96,374
## 13 20000 20600 CARHUAZ 0,6956 98,4724
## 14 20000 20700 CARLOS F. FITZCARRALD 0,4982 97,0656
## 15 20000 20800 CASMA 0,7466 96,9521
## 16 20000 20900 CORONGO 0,6702 96,2646
## 17 20000 21000 HUARI 0,6746 97,3123
## 18 20000 21100 HUARMEY 0,7574 98,0051
## 19 20000 21200 HUAYLAS 0,6615 97,3926
## 20 20000 21300 MARISCAL LUZURIAGA 0,5188 96,6549
## 21 20000 21400 OCROS 0,6367 97,9574
## 22 20000 21500 PALLASCA 0,6122 94,5362
## 23 20000 21600 POMABAMBA 0,5789 96,6389
## 24 20000 21700 RECUAY 0,711 97,7199
## 25 20000 21800 SANTA 0,8245 98,0871
## 26 20000 21900 SIHUAS 0,6091 96,7049
## 27 20000 22000 YUNGAY 0,6249 97,275
## 28 30000 30100 ABANCAY 0,7466 97,9042
## 29 30000 30200 ANDAHUAYLAS 0,718 98,366
## 30 30000 30300 ANTABAMBA 0,57 96,1608
## 31 30000 30400 AYMARAES 0,611 97,5102
## 32 30000 30500 COTABAMBAS 0,5426 95,6449
## 33 30000 30600 CHINCHEROS 0,624 97,966
## 34 30000 30700 GRAU 0,5827 95,6384
## 35 40000 40100 AREQUIPA 0,9075 99,4183
## 36 40000 40200 CAMANA 0,7811 98,728
## 37 40000 40300 CARAVELI 0,6946 98,4929
## 38 40000 40400 CASTILLA 0,7406 98,5589
## 39 40000 40500 CAYLLOMA 0,6621 98,578
## 40 40000 40600 CONDESUYOS 0,6454 97,9444
## 41 40000 40700 ISLAY 0,8179 98,504
## 42 40000 40800 LA UNION 0,6325 96,7653
## 43 50000 50100 HUAMANGA 0,7591 99,4419
## 44 50000 50200 CANGALLO 0,5701 99,5
## 45 50000 50300 HUANCA SANCOS 0,5723 99,5
## 46 50000 50400 HUANTA 0,5971 98,3271
## 47 50000 50500 LA MAR 0,4946 98,2364
## 48 50000 50600 LUCANAS 0,6193 99,1895
## 49 50000 50700 PARINACOCHAS 0,6471 99,4064
## 50 50000 50800 PAUCAR DEL SARA SARA 0,7159 98,665
## 51 50000 50900 SUCRE 0,6307 99,2637
## 52 50000 51000 VICTOR FAJARDO 0,6156 99,1369
## 53 50000 51100 VILCAS HUAMAN 0,5349 99,1387
## 54 60000 60100 CAJAMARCA 0,7481 98,0678
## 55 60000 60200 CAJABAMBA 0,5979 95,2706
## 56 60000 60300 CELENDIN 0,589 96,3898
## 57 60000 60400 CHOTA 0,5856 95,8657
## 58 60000 60500 CONTUMAZA 0,6327 96,95
## 59 60000 60600 CUTERVO 0,5462 97,1251
## 60 60000 60700 HUALGAYOC 0,5614 96,224
## 61 60000 60800 JAEN 0,6372 95,813
## 62 60000 60900 SAN IGNACIO 0,5762 95,7543
## 63 60000 61000 SAN MARCOS 0,5805 95,5956
## 64 60000 61100 SAN MIGUEL 0,5787 96,5258
## 65 60000 61200 SAN PABLO 0,5587 96,9911
## 66 60000 61300 SANTA CRUZ 0,5349 96,0784
## 67 70000 70100 CALLAO 0,8514 99,4939
## 68 80000 80100 CUSCO 0,8762 97,8854
## 69 80000 80200 ACOMAYO 0,6331 97,199
## 70 80000 80300 ANTA 0,6379 97,9755
## 71 80000 80400 CALCA 0,6321 96,954
## 72 80000 80500 CANAS 0,568 98,3403
## 73 80000 80600 CANCHIS 0,7344 97,838
## 74 80000 80700 CHUMBIVILCAS 0,5329 97,8608
## 75 80000 80800 ESPINAR 0,6109 98,7317
## 76 80000 80900 LA CONVENCION 0,6069 96,3227
## 77 80000 81000 PARURO 0,5573 97,6097
## 78 80000 81100 PAUCARTAMBO 0,5599 96,7844
## 79 80000 81200 QUISPICANCHI 0,618 97,6088
## 80 80000 81300 URUBAMBA 0,7234 96,0675
## 81 90000 90100 HUANCAVELICA 0,6477 98,9226
## 82 90000 90200 ACOBAMBA 0,5771 98,7516
## 83 90000 90300 ANGARAES 0,5913 98,439
## 84 90000 90400 CASTROVIRREYNA 0,5652 98,0852
## 85 90000 90500 CHURCAMPA 0,5615 97,9364
## 86 90000 90600 HUAYTARA 0,5709 97,4424
## 87 90000 90700 TAYACAJA 0,5827 97,2705
## 88 100000 100100 HUANUCO 0,7179 97,4669
## 89 100000 100200 AMBO 0,5594 97,9204
## 90 100000 100300 DOS DE MAYO 0,5822 96,8027
## 91 100000 100400 HUACAYBAMBA 0,5826 96,5215
## 92 100000 100500 HUAMALIES 0,5598 94,9934
## 93 100000 100600 LEONCIO PRADO 0,6803 95,4785
## 94 100000 100700 MARANON 0,477 96,8355
## 95 100000 100800 PACHITEA 0,4821 94,7089
## 96 100000 100900 PUERTO INCA 0,4807 90,0761
## 97 100000 101000 LAURICOCHA 0,5554 96,3078
## 98 100000 101100 YAROWILCA 0,5294 98,2606
## 99 110000 110100 ICA 0,845 99,5035
## 100 110000 110200 CHINCHA 0,7622 99,4989
## 101 110000 110300 NAZCA 0,7812 99,3843
## 102 110000 110400 PALPA 0,775 99,3064
## 103 110000 110500 PISCO 0,7092 99,2571
## 104 120000 120100 HUANCAYO 0,8151 98,8701
## 105 120000 120200 CONCEPCION 0,6705 97,8206
## 106 120000 120300 CHANCHAMAYO 0,6428 97,5518
## 107 120000 120400 JAUJA 0,7053 98,0137
## 108 120000 120500 JUNIN 0,6267 98,9176
## 109 120000 120600 SATIPO 0,5807 96,1116
## 110 120000 120700 TARMA 0,7105 98,8506
## 111 120000 120800 YAULI 0,7727 99,5
## 112 120000 120900 CHUPACA 0,6888 97,8224
## 113 130000 130100 TRUJILLO 0,888 99,3464
## 114 130000 130200 ASCOPE 0,7553 99,5
## 115 130000 130300 BOLIVAR 0,5894 96,7847
## 116 130000 130400 CHEPEN 0,757 99,096
## 117 130000 130500 JULCAN 0,5272 97,7276
## 118 130000 130600 OTUZCO 0,5877 97,0273
## 119 130000 130700 PACASMAYO 0,7841 99,301
## 120 130000 130800 PATAZ 0,6038 95,7538
## 121 130000 130900 SANCHEZ CARRION 0,4838 96,212
## 122 130000 131000 SANTIAGO DE CHUCO 0,5667 98,0769
## 123 130000 131100 GRAN CHIMU 0,5843 97,0097
## 124 130000 131200 VIRU 0,6949 98,3704
## 125 140000 140100 CHICLAYO 0,8317 98,4564
## 126 140000 140200 FERRENAFE 0,6891 96,8825
## 127 140000 140300 LAMBAYEQUE 0,6604 97,899
## 128 150000 150100 LIMA 0,8999 99,3591
## 129 150000 150200 BARRANCA 0,8118 99,295
## 130 150000 150300 CAJATAMBO 0,6624 97,773
## 131 150000 150400 CANTA 0,6628 98,6936
## 132 150000 150500 CANETE 0,7697 99,5034
## 133 150000 150600 HUARAL 0,777 99,0524
## 134 150000 150700 HUAROCHIRI 0,7134 99,0322
## 135 150000 150800 HUAURA 0,7884 99,4633
## 136 150000 150900 OYON 0,7104 99,0082
## 137 150000 151000 YAUYOS 0,6657 98,4199
## 138 160000 160100 MAYNAS 0,6779 95,9809
## 139 160000 160200 ALTO AMAZONAS 0,5685 94,0398
## 140 160000 160300 LORETO 0,507 89,8845
## 141 160000 160400 MARISCAL RAMON CASTILLA 0,4707 91,3034
## 142 160000 160500 REQUENA 0,5378 92,4981
## 143 160000 160600 UCAYALI 0,5572 90,6369
## 144 160000 160700 DATEM DEL MARANON 0,4295 81,9682
## 145 170000 170100 TAMBOPATA 0,8027 99,2041
## 146 170000 170200 MANU 0,5941 93,5355
## 147 170000 170300 TAHUAMANU 0,7263 99,5
## 148 180000 180100 MARISCAL NIETO 0,8263 99,4366
## 149 180000 180200 GENERAL SANCHEZ CERRO 0,6417 98,8706
## 150 180000 180300 ILO 0,8504 99,5
## 151 190000 190100 PASCO 0,7169 99,5
## 152 190000 190200 DANIEL ALCIDES CARRION 0,6271 99,5
## 153 190000 190300 OXAPAMPA 0,5744 94,7617
## 154 200000 200100 PIURA 0,7426 98,5621
## 155 200000 200200 AYABACA 0,5102 94,8213
## 156 200000 200300 HUANCABAMBA 0,5334 94,1863
## 157 200000 200400 MORROPON 0,6653 97,1181
## 158 200000 200500 PAITA 0,7154 99,2638
## 159 200000 200600 SULLANA 0,7548 97,9271
## 160 200000 200700 TALARA 0,8082 99,0036
## 161 200000 200800 SECHURA 0,6745 97,9712
## 162 210000 210100 PUNO 0,7483 98,9834
## 163 210000 210200 AZANGARO 0,5716 98,7557
## 164 210000 210300 CARABAYA 0,6022 98,2289
## 165 210000 210400 CHUCUITO 0,6036 98,6818
## 166 210000 210500 EL COLLAO 0,6141 99,407
## 167 210000 210600 HUANCANE 0,5866 98,59
## 168 210000 210700 LAMPA 0,5839 99,3094
## 169 210000 210800 MELGAR 0,6322 99,0987
## 170 210000 210900 MOHO 0,6098 98,1119
## 171 210000 211000 SAN ANTONIO DE PUTINA 0,5691 98,8164
## 172 210000 211100 SAN ROMAN 0,7813 99,0267
## 173 210000 211200 SANDIA 0,6152 98,5936
## 174 210000 211300 YUNGUYO 0,6807 98,3785
## 175 220000 220100 MOYOBAMBA 0,6832 95,7572
## 176 220000 220200 BELLAVISTA 0,6256 94,1988
## 177 220000 220300 EL DORADO 0,6066 96,8349
## 178 220000 220400 HUALLAGA 0,66 96,7308
## 179 220000 220500 LAMAS 0,6051 96,557
## 180 220000 220600 MARISCAL CACERES 0,6922 96,0263
## 181 220000 220700 PICOTA 0,6884 96,1658
## 182 220000 220800 RIOJA 0,6672 95,4084
## 183 220000 220900 SAN MARTIN 0,8285 98,3258
## 184 220000 221000 TOCACHE 0,6456 94,9457
## 185 230000 230100 TACNA 0,9104 99,4928
## 186 230000 230200 CANDARAVE 0,6521 99,5
## 187 230000 230300 JORGE BASADRE 0,8487 99,5
## 188 230000 230400 TARATA 0,7414 99,3157
## 189 240000 240100 TUMBES 0,7622 99,1184
## 190 240000 240200 CONTRALMIRANTE VILLAR 0,6659 99,1872
## 191 240000 240300 ZARUMILLA 0,6849 97,4754
## 192 250000 250100 CORONEL PORTILLO 0,667 97,5922
## 193 250000 250200 ATALAYA 0,4245 84,2895
## 194 250000 250300 PADRE ABAD 0,5023 97,3087
## 195 250000 250400 PURUS 0,4473 91,9667
## salud educacion saneamiento electrificacion poblacion costa capital
## 1 25,45 91,4986 70,3454 83,9712 54783 NO SI
## 2 14,6091 79,7902 64,479 67,9146 77438 NO NO
## 3 9,0102 76,424 54,8341 72,1693 32317 NO NO
## 4 8,557 52,2149 37,7145 39,4891 51802 NO NO
## 5 12,418 74,726 43,3484 67,3961 52185 NO NO
## 6 14,8787 79,4244 46,5018 67,5461 30236 NO NO
## 7 10,1102 77,1683 52,5195 63,1177 118747 NO NO
## 8 21,8066 95,0063 82,9326 93,1496 161003 NO SI
## 9 8,594 89,4989 47,7841 79,122 7974 NO NO
## 10 4,9923 77,7374 48,9181 73,8765 16879 NO NO
## 11 17,189 81,5383 67,1184 74,2923 9013 NO NO
## 12 9,4165 85,2385 61,385 79,1416 32452 NO NO
## 13 10,2247 72,057 73,2979 86,9098 46434 NO NO
## 14 9,0871 59,7295 29,4336 47,7474 21920 NO NO
## 15 10,0441 89,7711 81,9572 87,877 46032 SI NO
## 16 11,3027 78,1769 61,6929 80,1392 8340 NO NO
## 17 14,087 76,3536 60,0936 80,0751 63726 NO NO
## 18 13,3628 95,5122 75,2566 87,6444 29972 SI NO
## 19 14,3251 63,7338 69,345 76,4138 56102 NO NO
## 20 5,202 69,084 31,2854 53,7286 23888 NO NO
## 21 7,4294 93,4748 42,7468 71,765 10283 NO NO
## 22 9,7786 75,6362 44,66 74,9557 30536 NO NO
## 23 14,5264 63,921 49,764 54,9378 29196 NO NO
## 24 10,2591 90,2889 73,4154 76,9919 19509 NO NO
## 25 19,7013 96,4346 88,6281 96,2817 427157 SI NO
## 26 12,0564 69,5418 43,0137 75,1775 31006 NO NO
## 27 10,2298 62,354 67,3776 68,3959 57969 NO NO
## 28 16,9311 93,6909 63,0011 90,5064 105694 NO SI
## 29 12,4028 83,7088 72,297 83,9755 163662 NO NO
## 30 5,3211 91,055 25,2835 63,6509 13399 NO NO
## 31 4,9546 92,2419 34,5556 72,9106 32722 NO NO
## 32 6,0624 74,0475 33,988 57,4942 51667 NO NO
## 33 7,1636 81,505 53,1857 67,3993 57750 NO NO
## 34 8,5845 82,4632 27,8333 71,1088 26987 NO NO
## 35 40,4944 93,4114 95,5408 97,8951 936464 NO SI
## 36 21,3335 90,3838 82,9674 82,893 57187 SI NO
## 37 17,5497 80,9079 63,4413 75,1853 39317 SI NO
## 38 12,3108 82,4863 85,132 83,6063 38990 NO NO
## 39 10,9773 84,3677 58,4541 71,3575 86542 NO NO
## 40 12,945 83,2657 64,6445 55,2726 18540 NO NO
## 41 18,6627 94,2023 92,6318 92,52 53047 SI NO
## 42 19,7837 71,4648 61,8834 53,1603 15164 NO NO
## 43 19,1627 83,5629 74,3072 90,3163 261382 NO SI
## 44 10,6072 70,7635 45,1408 51,9452 34298 NO NO
## 45 10,4056 85,4506 26,8577 56,9772 10472 NO NO
## 46 7,8265 72,0394 50,3193 64,8231 102619 NO NO
## 47 5,9239 61,5692 30,5293 47,0695 87160 NO NO
## 48 10,0509 91,0306 36,7625 65,8977 67167 NO NO
## 49 13,4073 83,9144 43,3083 74,5507 32023 NO NO
## 50 14,4225 93,9172 54,0318 87,283 11028 NO NO
## 51 12,7053 86,8535 38,4042 69,6481 12255 NO NO
## 52 8,7686 77,8064 46,8821 69,3787 24213 NO NO
## 53 7,8826 72,025 45,8992 37,2551 23412 NO NO
## 54 15,7259 86,1347 76,1244 87,531 368639 NO SI
## 55 6,2862 66,8311 63,4764 62,887 80086 NO NO
## 56 6,3241 68,4681 57,1751 61,9291 95433 NO NO
## 57 6,9577 79,134 41,0023 65,2231 167670 NO NO
## 58 8,5074 89,5479 51,3358 64,3249 32602 NO NO
## 59 10,0209 72,5216 36,2101 50,5428 143667 NO NO
## 60 6,0375 71,3687 51,6709 51,3883 100009 NO NO
## 61 10,8123 83,2315 44,7478 76,7748 198354 NO NO
## 62 5,6695 76,5965 47,2578 59,029 145478 NO NO
## 63 4,4653 69,885 66,3363 50,9721 54622 NO NO
## 64 6,9082 85,777 48,1129 47,3965 57492 NO NO
## 65 3,7146 75,1291 55,086 45,9765 23885 NO NO
## 66 6,7198 87,9763 13,79 58,3943 45955 NO NO
## 67 26,4218 89,8493 93,0432 99,2529 969170 SI SI
## 68 30,5147 99,5 90,3696 99,5 427580 NO SI
## 69 10,4537 83,1267 48,2393 70,5703 28318 NO NO
## 70 4,6273 82,8919 43,5397 86,8348 57262 NO NO
## 71 6,3367 77,724 52,6436 78,1668 72583 NO NO
## 72 5,3289 84,5397 34,0964 58,153 39973 NO NO
## 73 10,8021 92,7148 70,1059 88,5203 102826 NO NO
## 74 6,0491 76,0087 39,4397 43,0746 81878 NO NO
## 75 8,9812 88,4132 45,8511 57,4631 68390 NO NO
## 76 9,2718 84,7681 40,9197 66,0037 179515 NO NO
## 77 4,8544 74,8891 41,1514 56,9302 31521 NO NO
## 78 6,1349 59,7834 46,3203 66,8591 50323 NO NO
## 79 4,9016 74,7613 52,6529 75,8022 88967 NO NO
## 80 11,1369 89,0927 59,2273 98,7497 63039 NO NO
## 81 8,4463 83,9779 40,4136 86,4489 153773 NO SI
## 82 2,6282 77,5408 31,1721 76,7208 73243 NO NO
## 83 3,004 76,8243 36,9268 78,4647 60816 NO NO
## 84 4,7333 99,5 20,8772 56,2698 19500 NO NO
## 85 3,7926 75,4469 25,9138 75,1098 45172 NO NO
## 86 6,9062 93,0713 24,043 59,383 23361 NO NO
## 87 4,6864 77,79 28,8652 79,6273 107715 NO NO
## 88 21,9022 84,4585 65,5353 74,9612 301396 NO SI
## 89 11,1829 74,8834 25,5836 62,6859 57957 NO NO
## 90 13,0303 74,0063 49,4522 49,1357 52025 NO NO
## 91 6,5479 66,9303 53,1725 63,7385 22403 NO NO
## 92 11,3609 75,2894 41,526 49,1445 73621 NO NO
## 93 18,5407 91,4246 51,5353 70,8055 129953 NO NO
## 94 6,7634 64,0645 23,8282 42,5136 30594 NO NO
## 95 8,922 52,4708 35,9075 43,0686 69003 NO NO
## 96 13,7197 68,0194 25,5408 33,8304 32060 NO NO
## 97 11,2596 82,0013 36,3976 44,2322 38257 NO NO
## 98 9,5985 76,9046 31,8684 41,6769 33715 NO NO
## 99 30,0232 87,7433 94,266 90,9563 349036 SI SI
## 100 16,2647 84,4472 83,1503 86,8764 210098 SI NO
## 101 18,7779 87,539 84,1663 88,2205 58817 SI NO
## 102 18,157 85,4934 91,1803 81,2415 12621 NO NO
## 103 13,8738 84,8986 70,459 76,8762 132986 SI NO
## 104 20,3101 94,5642 85,4177 94,8395 497299 NO SI
## 105 6,3452 85,5002 58,1659 83,1976 58942 NO NO
## 106 8,1031 80,7343 58,9306 70,703 193140 NO NO
## 107 10,3796 90,8331 55,8857 90,6086 88524 NO NO
## 108 12,5177 88,0828 23,2858 82,1882 27722 NO NO
## 109 5,1873 72,4222 51,8365 61,3319 244727 NO NO
## 110 10,9357 84,8047 62,1884 91,1852 111631 NO NO
## 111 12,4015 99,0315 75,5876 91,573 45858 NO NO
## 112 6,7123 93,7842 58,9627 82,6588 53564 NO NO
## 113 32,9186 95,7003 98,0614 96,0229 914036 SI SI
## 114 17,602 96,5098 65,4569 86,8584 120884 SI NO
## 115 17,0746 59,0046 51,4671 58,9619 16910 NO NO
## 116 13,0308 92,1739 84,7516 80,7373 84037 SI NO
## 117 9,0297 60,0022 54,2229 36,6195 32400 NO NO
## 118 11,9985 59,9136 61,6578 55,241 92237 NO NO
## 119 15,9519 93,8715 82,1331 90,1695 101954 SI NO
## 120 11,8223 61,6108 58,1123 66,7366 85687 NO NO
## 121 8,273 48,1215 39,5255 44,2572 149616 NO NO
## 122 11,9058 68,7819 45,5874 51,0685 61329 NO NO
## 123 10,7215 67,204 66,2424 43,8284 31402 NO NO
## 124 5,9394 74,0766 84,9306 80,1798 101167 SI NO
## 125 25,7449 88,9529 86,0233 99,5 836299 SI SI
## 126 14,0778 73,4821 76,3114 74,4212 104820 NO NO
## 127 8,3964 72,9188 73,0946 72,3053 288141 SI NO
## 128 38,3657 89,5797 97,5604 99,5 8481415 SI SI
## 129 21,4062 83,9918 96,9944 89,9645 143216 SI NO
## 130 16,2382 78,1014 51,6375 76,623 8139 NO NO
## 131 29,0179 76,8965 39,9944 67,4349 14669 NO NO
## 132 16,3725 86,2599 86,3501 85,4381 222877 SI NO
## 133 17,7469 84,0086 85,1771 90,6684 182409 SI NO
## 134 16,2867 81,9827 73,6597 74,8972 79177 NO NO
## 135 22,032 84,1302 85,147 88,7237 213188 SI NO
## 136 9,4051 77,9139 77,8538 84,76 22217 NO NO
## 137 14,4953 83,6558 52,3377 74,2986 27842 NO NO
## 138 12,4254 79,0188 57,2983 85,9357 550031 NO SI
## 139 10,814 61,7112 44,4909 66,0007 117163 NO NO
## 140 6,2437 60,1239 32,464 60,621 69508 NO NO
## 141 4,5533 55,2372 23,2198 58,0174 67143 NO NO
## 142 4,9098 64,907 27,0976 76,2223 72706 NO NO
## 143 4,5009 71,0551 33,5148 75,8978 70782 NO NO
## 144 4,7538 44,0338 32,0778 48,7369 59620 NO NO
## 145 26,2887 86,1364 84,2227 87,9527 91988 NO SI
## 146 12,1582 81,1164 37,0703 65,0632 22906 NO NO
## 147 27,4945 82,3381 56,4859 79,0064 12745 NO NO
## 148 26,9476 94,0548 80,8463 93,9171 78890 NO SI
## 149 13,2708 86,5558 38,3928 74,9002 27275 NO NO
## 150 21,2476 91,3031 99,5 99,5 68694 SI NO
## 151 10,7282 94,3146 58,5859 88,1771 156259 NO SI
## 152 4,6297 95,0075 41,9339 69,4167 51789 NO NO
## 153 12,5667 65,4202 42,7355 63,3166 89543 NO NO
## 154 15,3145 89,086 77,9517 80,1926 734437 SI SI
## 155 3,6732 60,0579 51,9557 42,1461 141708 NO NO
## 156 5,6703 65,4099 56,4812 41,1786 127423 NO NO
## 157 7,3392 80,9296 67,5797 74,8067 159486 NO NO
## 158 6,7769 85,3579 76,5216 85,2715 122725 SI NO
## 159 12,9206 91,7215 78,0363 88,1845 309605 NO NO
## 160 17,2074 97,9404 84,5123 93,9844 133148 SI NO
## 161 5,9599 79,84 72,387 77,137 71075 NO NO
## 162 18,5388 93,596 64,1132 86,5741 244692 NO SI
## 163 2,9063 81,044 39,6135 61,5461 139092 NO NO
## 164 4,6188 74,6275 52,4479 68,1171 87812 NO NO
## 165 3,6953 88,2616 37,3401 71,3466 142711 NO NO
## 166 4,2362 92,492 34,7087 73,3596 84865 NO NO
## 167 6,42 86,7475 33,66 63,5913 67726 NO NO
## 168 5,6917 83,7246 39,5906 59,8291 51039 NO NO
## 169 6,044 81,0894 60,8358 65,0074 77355 NO NO
## 170 2,598 83,4812 45,2047 73,7554 26799 NO NO
## 171 2,64 88,4295 29,5768 63,3287 62247 NO NO
## 172 15,507 94,0194 72,2405 99,5 276352 NO NO
## 173 6,4219 84,2576 50,2309 63,8324 68253 NO NO
## 174 6,8712 87,114 52,7099 90,6861 48179 NO NO
## 175 9,9368 83,2734 72,5388 73,4589 136414 NO SI
## 176 7,979 76,7049 59,9836 68,6068 55815 NO NO
## 177 7,7403 66,9119 68,0806 58,5684 38152 NO NO
## 178 11,4771 78,1732 74,7704 61,2204 25357 NO NO
## 179 6,3469 72,5867 61,5244 61,297 83825 NO NO
## 180 9,981 85,2023 75,5526 72,7025 51489 NO NO
## 181 7,8023 82,3184 73,9773 78,7176 42369 NO NO
## 182 10,3815 83,083 58,2882 79,4966 120387 NO NO
## 183 21,3298 99,5 85,3935 95,5041 179184 NO NO
## 184 10,5095 92,4323 43,6077 74,3133 73460 NO NO
## 185 44,7413 90,0518 95,8766 95,2144 302852 SI SI
## 186 7,1132 90,0467 40,1112 84,534 8435 NO NO
## 187 30,0799 97,3276 83,9754 93,4183 9641 SI NO
## 188 22,5366 90,173 68,7254 74,9025 7987 NO NO
## 189 18,382 86,2661 77,6778 87,4196 159548 SI SI
## 190 6,6236 81,4642 59,7919 81,4494 19180 SI NO
## 191 6,9758 81,2087 71,0227 81,1197 49499 SI NO
## 192 12,5195 85,4286 42,8511 86,7715 366040 NO SI
## 193 4,5206 55,4652 13,2425 51,7253 50569 NO NO
## 194 4,4984 73,2013 13,243 59,8946 56756 NO NO
## 195 15,9542 51,3878 0,2351 53,4704 4251 NO NO
## tamano
## 1 Pequena
## 2 Pequena
## 3 Muy pequena
## 4 Pequena
## 5 Pequena
## 6 Muy pequena
## 7 Mediana
## 8 Mediana
## 9 Muy pequena
## 10 Muy pequena
## 11 Muy pequena
## 12 Muy pequena
## 13 Muy pequena
## 14 Muy pequena
## 15 Muy pequena
## 16 Muy pequena
## 17 Pequena
## 18 Muy pequena
## 19 Pequena
## 20 Muy pequena
## 21 Muy pequena
## 22 Muy pequena
## 23 Muy pequena
## 24 Muy pequena
## 25 Grande
## 26 Muy pequena
## 27 Pequena
## 28 Mediana
## 29 Mediana
## 30 Muy pequena
## 31 Muy pequena
## 32 Pequena
## 33 Pequena
## 34 Muy pequena
## 35 Grande
## 36 Pequena
## 37 Muy pequena
## 38 Muy pequena
## 39 Pequena
## 40 Muy pequena
## 41 Pequena
## 42 Muy pequena
## 43 Mediana
## 44 Muy pequena
## 45 Muy pequena
## 46 Mediana
## 47 Pequena
## 48 Pequena
## 49 Muy pequena
## 50 Muy pequena
## 51 Muy pequena
## 52 Muy pequena
## 53 Muy pequena
## 54 Grande
## 55 Pequena
## 56 Pequena
## 57 Mediana
## 58 Muy pequena
## 59 Mediana
## 60 Mediana
## 61 Mediana
## 62 Mediana
## 63 Pequena
## 64 Pequena
## 65 Muy pequena
## 66 Muy pequena
## 67 Grande
## 68 Grande
## 69 Muy pequena
## 70 Pequena
## 71 Pequena
## 72 Muy pequena
## 73 Mediana
## 74 Pequena
## 75 Pequena
## 76 Mediana
## 77 Muy pequena
## 78 Pequena
## 79 Pequena
## 80 Pequena
## 81 Mediana
## 82 Pequena
## 83 Pequena
## 84 Muy pequena
## 85 Muy pequena
## 86 Muy pequena
## 87 Mediana
## 88 Grande
## 89 Pequena
## 90 Pequena
## 91 Muy pequena
## 92 Pequena
## 93 Mediana
## 94 Muy pequena
## 95 Pequena
## 96 Muy pequena
## 97 Muy pequena
## 98 Muy pequena
## 99 Grande
## 100 Mediana
## 101 Pequena
## 102 Muy pequena
## 103 Mediana
## 104 Grande
## 105 Pequena
## 106 Mediana
## 107 Pequena
## 108 Muy pequena
## 109 Mediana
## 110 Mediana
## 111 Muy pequena
## 112 Pequena
## 113 Grande
## 114 Mediana
## 115 Muy pequena
## 116 Pequena
## 117 Muy pequena
## 118 Pequena
## 119 Mediana
## 120 Pequena
## 121 Mediana
## 122 Pequena
## 123 Muy pequena
## 124 Mediana
## 125 Grande
## 126 Mediana
## 127 Mediana
## 128 Muy grande
## 129 Mediana
## 130 Muy pequena
## 131 Muy pequena
## 132 Mediana
## 133 Mediana
## 134 Pequena
## 135 Mediana
## 136 Muy pequena
## 137 Muy pequena
## 138 Grande
## 139 Mediana
## 140 Pequena
## 141 Pequena
## 142 Pequena
## 143 Pequena
## 144 Pequena
## 145 Pequena
## 146 Muy pequena
## 147 Muy pequena
## 148 Pequena
## 149 Muy pequena
## 150 Pequena
## 151 Mediana
## 152 Pequena
## 153 Pequena
## 154 Grande
## 155 Mediana
## 156 Mediana
## 157 Mediana
## 158 Mediana
## 159 Grande
## 160 Mediana
## 161 Pequena
## 162 Mediana
## 163 Mediana
## 164 Pequena
## 165 Mediana
## 166 Pequena
## 167 Pequena
## 168 Pequena
## 169 Pequena
## 170 Muy pequena
## 171 Pequena
## 172 Mediana
## 173 Pequena
## 174 Muy pequena
## 175 Mediana
## 176 Pequena
## 177 Muy pequena
## 178 Muy pequena
## 179 Pequena
## 180 Pequena
## 181 Muy pequena
## 182 Mediana
## 183 Mediana
## 184 Pequena
## 185 Grande
## 186 Muy pequena
## 187 Muy pequena
## 188 Muy pequena
## 189 Mediana
## 190 Muy pequena
## 191 Muy pequena
## 192 Grande
## 193 Pequena
## 194 Pequena
## 195 Muy pequena
str(datos)
## 'data.frame': 195 obs. of 13 variables:
## $ regionUbigeo : int 10000 10000 10000 10000 10000 10000 10000 20000 20000 20000 ...
## $ provinciaUbigeo: int 10100 10200 10300 10400 10500 10600 10700 20100 20200 20300 ...
## $ PROVINCIA : chr "CHACHAPOYAS" "BAGUA" "BONGARA" "CONDORCANQUI" ...
## $ IDE : chr "0,7737" "0,6623" "0,6318" "0,4598" ...
## $ identidad : chr "98,6179" "94,6079" "97,4681" "86,232" ...
## $ salud : chr "25,45" "14,6091" "9,0102" "8,557" ...
## $ educacion : chr "91,4986" "79,7902" "76,424" "52,2149" ...
## $ saneamiento : chr "70,3454" "64,479" "54,8341" "37,7145" ...
## $ electrificacion: chr "83,9712" "67,9146" "72,1693" "39,4891" ...
## $ poblacion : int 54783 77438 32317 51802 52185 30236 118747 161003 7974 16879 ...
## $ costa : chr "NO" "NO" "NO" "NO" ...
## $ capital : chr "SI" "NO" "NO" "NO" ...
## $ tamano : chr "Pequena" "Pequena" "Muy pequena" "Pequena" ...
library(readr)
datos[,c(4:9)]=lapply(datos[,c(4:9)],parse_number)
str(datos)
## 'data.frame': 195 obs. of 13 variables:
## $ regionUbigeo : int 10000 10000 10000 10000 10000 10000 10000 20000 20000 20000 ...
## $ provinciaUbigeo: int 10100 10200 10300 10400 10500 10600 10700 20100 20200 20300 ...
## $ PROVINCIA : chr "CHACHAPOYAS" "BAGUA" "BONGARA" "CONDORCANQUI" ...
## $ IDE : num 7737 6623 6318 4598 6047 ...
## $ identidad : num 986179 946079 974681 86232 961927 ...
## $ salud : num 2545 146091 90102 8557 12418 ...
## $ educacion : num 914986 797902 76424 522149 74726 ...
## $ saneamiento : num 703454 64479 548341 377145 433484 ...
## $ electrificacion: num 839712 679146 721693 394891 673961 ...
## $ poblacion : int 54783 77438 32317 51802 52185 30236 118747 161003 7974 16879 ...
## $ costa : chr "NO" "NO" "NO" "NO" ...
## $ capital : chr "SI" "NO" "NO" "NO" ...
## $ tamano : chr "Pequena" "Pequena" "Muy pequena" "Pequena" ...
Analizo la dependiente.
NORMALIDAD: SHAPIRO WILK
shapiro.test(datos$identidad)
##
## Shapiro-Wilk normality test
##
## data: datos$identidad
## W = 0.52227, p-value < 2.2e-16
A=lm(identidad~salud+ educacion+ saneamiento+electrificacion+poblacion+costa+capital+tamano,data=datos)
summary(A)
##
## Call:
## lm(formula = identidad ~ salud + educacion + saneamiento + electrificacion +
## poblacion + costa + capital + tamano, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -905691 20356 129931 193114 360597
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 9.269e+05 2.411e+05 3.845 0.000166 ***
## salud -5.905e-01 4.246e-01 -1.391 0.165996
## educacion -1.149e-01 9.121e-02 -1.260 0.209185
## saneamiento -1.469e-02 1.191e-01 -0.123 0.902009
## electrificacion 1.799e-01 1.005e-01 1.791 0.074995 .
## poblacion 2.242e-01 3.512e-01 0.638 0.524088
## costaSI -1.148e+05 8.028e+04 -1.430 0.154363
## capitalSI 1.141e+05 1.109e+05 1.029 0.304912
## tamanoMediana -1.476e+05 1.796e+05 -0.822 0.412323
## tamanoMuy grande -1.490e+06 2.795e+06 -0.533 0.594555
## tamanoMuy pequena -5.475e+04 2.144e+05 -0.255 0.798710
## tamanoPequena -1.481e+05 2.034e+05 -0.728 0.467519
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 344200 on 183 degrees of freedom
## Multiple R-squared: 0.08821, Adjusted R-squared: 0.0334
## F-statistic: 1.609 on 11 and 183 DF, p-value: 0.09908
B=lm(salud~identidad+ educacion+ saneamiento+electrificacion+poblacion+costa+capital+tamano,data=datos)
summary(B)
##
## Call:
## lm(formula = salud ~ identidad + educacion + saneamiento + electrificacion +
## poblacion + costa + capital + tamano, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -169697 -34471 -7018 32612 194280
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.157e+05 4.255e+04 2.720 0.00716 **
## identidad -1.771e-02 1.274e-02 -1.391 0.16600
## educacion 5.808e-03 1.586e-02 0.366 0.71464
## saneamiento 4.710e-02 2.034e-02 2.316 0.02167 *
## electrificacion 1.908e-02 1.750e-02 1.091 0.27692
## poblacion 3.141e-02 6.085e-02 0.516 0.60634
## costaSI 3.950e+04 1.367e+04 2.889 0.00433 **
## capitalSI 6.086e+04 1.872e+04 3.250 0.00137 **
## tamanoMediana -7.375e+04 3.069e+04 -2.403 0.01726 *
## tamanoMuy grande -1.324e+05 4.844e+05 -0.273 0.78485
## tamanoMuy pequena -3.899e+04 3.702e+04 -1.053 0.29371
## tamanoPequena -6.643e+04 3.493e+04 -1.902 0.05876 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 59610 on 183 degrees of freedom
## Multiple R-squared: 0.4564, Adjusted R-squared: 0.4237
## F-statistic: 13.97 on 11 and 183 DF, p-value: < 2.2e-16
SANEAMIENTO - COSTA (NUM-CAT)
JAJA= formula (saneamiento ~ costa)
aggregate (JAJA, datos, median)
## costa saneamiento
## 1 NO 477841.0
## 2 SI 830588.5
library(knitr)
san= aggregate(JAJA, datos,
FUN = function(x) {y <- shapiro.test(x); c(y$statistic, y$p.value)})
# para que se vea mejor:
library(knitr)
shapiroTest=as.data.frame(san[,2])
names(shapiroTest)=c("W","Prob")
kable(cbind(san[1],shapiroTest))
costa | W | Prob |
---|---|---|
NO | 0.9753667 | 0.0052318 |
SI | 0.7074454 | 0.0000011 |
library(ggpubr)
ggqqplot(data= datos, x="saneamiento") + facet_grid(. ~ costa)
camino NO PARAMÉTRICO.
wilcox.test(JAJA,datos)
##
## Wilcoxon rank sum test with continuity correction
##
## data: saneamiento by costa
## W = 869, p-value = 2.582e-09
## alternative hypothesis: true location shift is not equal to 0
EL P-VALUE ES SIGNIFICATIVO, SE RECHAZA LA HIPÓTESIS. POR LO TANTO, HAY DIFERENCIA DE MEDIAS.
ggplot(data=datos, aes(x=costa, y=saneamiento)) + geom_boxplot(notch = T)
## notch went outside hinges. Try setting notch=FALSE.
Se comprueba la diferencia.