library(htmltab)
linkPage="https://es.wikipedia.org/wiki/%C3%8Dndice_global_de_felicidad"
linkTabla="///div/table"
corrupcion=htmltab(doc=linkPage, which=linkTabla)
names(corrupcion)
## [1] "№"                                     
## [2] "País"                                  
## [3] "Puntuación"                            
## [4] "PIB per cápita"                        
## [5] "Apoyo social"                          
## [6] "Esperanza de años de vida saludable"   
## [7] "Libertad para tomar decisiones vitales"
## [8] "Generosidad"                           
## [9] "Percepción de la corrupción"
library(stringr) 
names(corrupcion)=str_split(names(corrupcion)," ",simplify = T)[,1]
str(corrupcion)
## 'data.frame':    156 obs. of  9 variables:
##  $ №          : chr  "1" "2" "3" "4" ...
##  $ País       : chr  "Finlandia" "Colombia" "Noruega" "Dinamarca" ...
##  $ Puntuación : chr  "7.633" "7.594" "7.560" "7.555" ...
##  $ PIB        : chr  "1.305" "1.456" "1.372" "1.351" ...
##  $ Apoyo      : chr  "1.592" "1.582" "1.595" "1.590" ...
##  $ Esperanza  : chr  "0.874" "0.873" "0.870" "0.868" ...
##  $ Libertad   : chr  "0.681" "0.686" "0.685" "0.683" ...
##  $ Generosidad: chr  "0.192" "0.286" "0.285" "0.284" ...
##  $ Percepción : chr  "0.393" "0.130" "0.410" "0.408" ...
library(readr)

corrupcion[,c(1,3:9)]=lapply(corrupcion[,c(1,3:9)],parse_number)
str(corrupcion)
## 'data.frame':    156 obs. of  9 variables:
##  $ №          : num  1 2 3 4 5 6 7 8 9 10 ...
##  $ País       : chr  "Finlandia" "Colombia" "Noruega" "Dinamarca" ...
##  $ Puntuación : num  7.63 7.59 7.56 7.55 7.5 ...
##  $ PIB        : num  1.3 1.46 1.37 1.35 1.34 ...
##  $ Apoyo      : num  1.59 1.58 1.59 1.59 1.64 ...
##  $ Esperanza  : num  0.874 0.873 0.87 0.868 0.914 0.927 0.878 0.896 0.876 0.913 ...
##  $ Libertad   : num  0.681 0.686 0.685 0.683 0.677 0.66 0.638 0.653 0.669 0.659 ...
##  $ Generosidad: num  0.192 0.286 0.285 0.284 0.353 0.256 0.333 0.321 0.365 0.285 ...
##  $ Percepción : num  0.393 0.13 0.41 0.408 0.138 0.357 0.295 0.291 0.389 0.383 ...

Analizo la dependiente

NORMALIDAD: SHAPIRO WILK

shapiro.test(corrupcion$Percepción)
## 
##  Shapiro-Wilk normality test
## 
## data:  corrupcion$Percepción
## W = 0.81431, p-value = 8.486e-13

Veo que no hay normalidad.

ASIMETRÍA Y ATÍPICOS:

library(DescTools) # instalar antes

Skew(corrupcion$Percepción)
## [1] 1.671663

La cola de atípicos va a la derecha

-Luego sabré si usar paramétrica o no paramétrica al compararla con las independientes

HISTOGRAMA:

library(ggplot2)

base=ggplot(data=corrupcion, aes(x=Percepción))
base+geom_histogram(bins=20) #usar 20 siempre

Efectivamente, asimetría positivia.

BOXPLOT

base=ggplot(data=corrupcion, aes(y=Percepción))
base+geom_boxplot() + coord_flip()

Analisis bivariado

CORRUPCION-GENEROSIDAD (NUM NUM)

f1=formula(~ Percepción + Generosidad)
library(dlookr)
## Loading required package: mice
## Loading required package: lattice
## 
## Attaching package: 'mice'
## The following objects are masked from 'package:base':
## 
##     cbind, rbind
## Registered S3 method overwritten by 'xts':
##   method     from
##   as.zoo.xts zoo
## Registered S3 method overwritten by 'quantmod':
##   method            from
##   as.zoo.data.frame zoo
## Registered S3 method overwritten by 'gdata':
##   method         from     
##   reorder.factor DescTools
## Registered S3 methods overwritten by 'car':
##   method                          from
##   influence.merMod                lme4
##   cooks.distance.influence.merMod lme4
##   dfbeta.influence.merMod         lme4
##   dfbetas.influence.merMod        lme4
## Warning in fun(libname, pkgname): couldn't connect to display ":0"
## 
## Attaching package: 'dlookr'
## The following object is masked from 'package:base':
## 
##     transform
normality(corrupcion[,c(9,8)])
## Warning: `cols` is now required.
## Please use `cols = c(statistic)`
## # A tibble: 2 x 4
##   vars        statistic  p_value sample
##   <chr>           <dbl>    <dbl>  <dbl>
## 1 Percepción      0.814 8.49e-13    156
## 2 Generosidad     0.960 1.79e- 4    156
  cor.test(f1,data=corrupcion,method = "spearm",exact=F)
## 
##  Spearman's rank correlation rho
## 
## data:  Percepción and Generosidad
## S = 446261, p-value = 0.0001883
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.2946834
  library(ggpubr)
## Loading required package: magrittr
  f1=ggscatter(corrupcion, x = "Generosidad", y = "Corrupcion", cor.coef = TRUE, cor.method = "spearman",  
  add = "reg.line", add.params = list(color = "blue", fill = "lightgray"), conf.int = TRUE) 

El p-value es significativo, por lo tanto, rechazo la hipótesis. HAY CORRELACION ENTRE LAS VARIABLES

PERCEPCION-APOYOSOCIAL

f2=formula(~ Percepción + Apoyo)
library(dlookr)
normality(corrupcion[,c(9,5)])
## Warning: `cols` is now required.
## Please use `cols = c(statistic)`
## # A tibble: 2 x 4
##   vars       statistic  p_value sample
##   <chr>          <dbl>    <dbl>  <dbl>
## 1 Percepción     0.814 8.49e-13    156
## 2 Apoyo          0.917 8.71e- 8    156
  cor.test(f2,data=corrupcion,method = "spearm",exact=F)
## 
##  Spearman's rank correlation rho
## 
## data:  Percepción and Apoyo
## S = 533248, p-value = 0.05001
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.1571998
  library(ggpubr)
  f2=ggscatter(corrupcion, x = "Generosidad", y = "Corrupcion", cor.coef = TRUE, cor.method = "spearman",  
  add = "reg.line", add.params = list(color = "blue", fill = "lightgray"), conf.int = TRUE) 

No es significativo, se comprueba la hipótesis: no hay relación entre las variables.

PERCEPCION-ESPERANZA

f3=formula(~ Percepción + Esperanza)
library(dlookr)
normality(corrupcion[,c(9,6)])
## Warning: `cols` is now required.
## Please use `cols = c(statistic)`
## # A tibble: 2 x 4
##   vars       statistic  p_value sample
##   <chr>          <dbl>    <dbl>  <dbl>
## 1 Percepción     0.814 8.49e-13    156
## 2 Esperanza      0.954 5.15e- 5    156
  cor.test(f3,data=corrupcion,method = "spearm",exact=F)
## 
##  Spearman's rank correlation rho
## 
## data:  Percepción and Esperanza
## S = 497598, p-value = 0.007436
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.2135453
  library(ggpubr)
  f3=ggscatter(corrupcion, x = "Generosidad", y = "Corrupcion", cor.coef = TRUE, cor.method = "spearman",  
  add = "reg.line", add.params = list(color = "blue", fill = "lightgray"), conf.int = TRUE) 

Es significativo, por lo tanto, se rechaza la hipotesis. SI HAY CORRELACIÓN ENTRE LAS VARIABLES.

PERCEPCION - PIB

f4=formula(~ Percepción + PIB)
library(dlookr)
normality(corrupcion[,c(9,4)])
## Warning: `cols` is now required.
## Please use `cols = c(statistic)`
## # A tibble: 2 x 4
##   vars       statistic  p_value sample
##   <chr>          <dbl>    <dbl>  <dbl>
## 1 Percepción     0.814 8.49e-13    156
## 2 PIB            0.977 1.18e- 2    156
  cor.test(f4,data=corrupcion,method = "spearm",exact=F)
## 
##  Spearman's rank correlation rho
## 
## data:  Percepción and PIB
## S = 478238, p-value = 0.00213
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##      rho 
## 0.244144
  library(ggpubr)
  f4=ggscatter(corrupcion, x = "Generosidad", y = "Corrupcion", cor.coef = TRUE, cor.method = "spearman",  
  add = "reg.line", add.params = list(color = "blue", fill = "lightgray"), conf.int = TRUE) 

Es significativo: sí correlación entre las hipótesis.

  ALFIN=lm(Percepción~Generosidad+Apoyo+Esperanza+PIB,data=corrupcion)

summary(ALFIN)
## 
## Call:
## lm(formula = Percepción ~ Generosidad + Apoyo + Esperanza + 
##     PIB, data = corrupcion)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.19572 -0.05740 -0.00856  0.03661  0.36006 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -0.022364   0.031306  -0.714    0.476    
## Generosidad  0.349680   0.070670   4.948 1.98e-06 ***
## Apoyo       -0.004541   0.032131  -0.141    0.888    
## Esperanza    0.066199   0.054222   1.221    0.224    
## PIB          0.042050   0.034452   1.221    0.224    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.08655 on 151 degrees of freedom
## Multiple R-squared:  0.2282, Adjusted R-squared:  0.2077 
## F-statistic: 11.16 on 4 and 151 DF,  p-value: 5.862e-08

NORMALIDAD: SHAPIRO WILK

shapiro.test(corrupcion$Esperanza)
## 
##  Shapiro-Wilk normality test
## 
## data:  corrupcion$Esperanza
## W = 0.95408, p-value = 5.151e-05

ASIMETRÍA Y ATÍPICOS:

library(DescTools) # instalar antes

Skew(corrupcion$Esperanza)
## [1] -0.5189681
  ALFIN2=lm(Esperanza~Generosidad+Apoyo+Esperanza+PIB+Percepción,data=corrupcion)
## Warning in model.matrix.default(mt, mf, contrasts): the response appeared
## on the right-hand side and was dropped
## Warning in model.matrix.default(mt, mf, contrasts): problem with term 3 in
## model.matrix: no columns are assigned
summary(ALFIN2)
## 
## Call:
## lm(formula = Esperanza ~ Generosidad + Apoyo + Esperanza + PIB + 
##     Percepción, data = corrupcion)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.44146 -0.06596  0.01314  0.08111  0.25236 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 0.001894   0.046834   0.040  0.96780    
## Generosidad 0.011424   0.113777   0.100  0.92015    
## Apoyo       0.147817   0.046458   3.182  0.00178 ** 
## PIB         0.446014   0.036827  12.111  < 2e-16 ***
## Percepción  0.147657   0.120943   1.221  0.22403    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.1293 on 151 degrees of freedom
## Multiple R-squared:  0.7366, Adjusted R-squared:  0.7297 
## F-statistic: 105.6 on 4 and 151 DF,  p-value: < 2.2e-16

#eldíademisuerte

link="https://docs.google.com/spreadsheets/d/e/2PACX-1vRUGflbewVnSJRVcdJlyyQlCOwjrG00LwlFcyX2GCi1Jv7BLr4oBkBJIX9NemMVZuvbgOYKYGbhFd_R/pub?gid=1465619154&single=true&output=csv"

Para entregarle datos al objeto uso la función read.csv

datos=read.csv(link, stringsAsFactors = F,na.strings = "")
datos
##     regionUbigeo provinciaUbigeo               PROVINCIA    IDE identidad
## 1          10000           10100             CHACHAPOYAS 0,7737   98,6179
## 2          10000           10200                   BAGUA 0,6623   94,6079
## 3          10000           10300                 BONGARA 0,6318   97,4681
## 4          10000           10400            CONDORCANQUI 0,4598    86,232
## 5          10000           10500                    LUYA 0,6047   96,1927
## 6          10000           10600    RODRIGUEZ DE MENDOZA 0,6312   97,3431
## 7          10000           10700               UTCUBAMBA 0,6097   95,1745
## 8          20000           20100                  HUARAZ 0,8119   98,5073
## 9          20000           20200                    AIJA 0,6579   98,2344
## 10         20000           20300        ANTONIO RAYMONDI 0,6113   96,8158
## 11         20000           20400                ASUNCION 0,6975   97,1484
## 12         20000           20500               BOLOGNESI 0,6757    96,374
## 13         20000           20600                 CARHUAZ 0,6956   98,4724
## 14         20000           20700   CARLOS F. FITZCARRALD 0,4982   97,0656
## 15         20000           20800                   CASMA 0,7466   96,9521
## 16         20000           20900                 CORONGO 0,6702   96,2646
## 17         20000           21000                   HUARI 0,6746   97,3123
## 18         20000           21100                 HUARMEY 0,7574   98,0051
## 19         20000           21200                 HUAYLAS 0,6615   97,3926
## 20         20000           21300      MARISCAL LUZURIAGA 0,5188   96,6549
## 21         20000           21400                   OCROS 0,6367   97,9574
## 22         20000           21500                PALLASCA 0,6122   94,5362
## 23         20000           21600               POMABAMBA 0,5789   96,6389
## 24         20000           21700                  RECUAY  0,711   97,7199
## 25         20000           21800                   SANTA 0,8245   98,0871
## 26         20000           21900                  SIHUAS 0,6091   96,7049
## 27         20000           22000                  YUNGAY 0,6249    97,275
## 28         30000           30100                 ABANCAY 0,7466   97,9042
## 29         30000           30200             ANDAHUAYLAS  0,718    98,366
## 30         30000           30300               ANTABAMBA   0,57   96,1608
## 31         30000           30400                AYMARAES  0,611   97,5102
## 32         30000           30500              COTABAMBAS 0,5426   95,6449
## 33         30000           30600              CHINCHEROS  0,624    97,966
## 34         30000           30700                    GRAU 0,5827   95,6384
## 35         40000           40100                AREQUIPA 0,9075   99,4183
## 36         40000           40200                  CAMANA 0,7811    98,728
## 37         40000           40300                CARAVELI 0,6946   98,4929
## 38         40000           40400                CASTILLA 0,7406   98,5589
## 39         40000           40500                CAYLLOMA 0,6621    98,578
## 40         40000           40600              CONDESUYOS 0,6454   97,9444
## 41         40000           40700                   ISLAY 0,8179    98,504
## 42         40000           40800                LA UNION 0,6325   96,7653
## 43         50000           50100                HUAMANGA 0,7591   99,4419
## 44         50000           50200                CANGALLO 0,5701      99,5
## 45         50000           50300           HUANCA SANCOS 0,5723      99,5
## 46         50000           50400                  HUANTA 0,5971   98,3271
## 47         50000           50500                  LA MAR 0,4946   98,2364
## 48         50000           50600                 LUCANAS 0,6193   99,1895
## 49         50000           50700            PARINACOCHAS 0,6471   99,4064
## 50         50000           50800    PAUCAR DEL SARA SARA 0,7159    98,665
## 51         50000           50900                   SUCRE 0,6307   99,2637
## 52         50000           51000          VICTOR FAJARDO 0,6156   99,1369
## 53         50000           51100           VILCAS HUAMAN 0,5349   99,1387
## 54         60000           60100               CAJAMARCA 0,7481   98,0678
## 55         60000           60200               CAJABAMBA 0,5979   95,2706
## 56         60000           60300                CELENDIN  0,589   96,3898
## 57         60000           60400                   CHOTA 0,5856   95,8657
## 58         60000           60500               CONTUMAZA 0,6327     96,95
## 59         60000           60600                 CUTERVO 0,5462   97,1251
## 60         60000           60700               HUALGAYOC 0,5614    96,224
## 61         60000           60800                    JAEN 0,6372    95,813
## 62         60000           60900             SAN IGNACIO 0,5762   95,7543
## 63         60000           61000              SAN MARCOS 0,5805   95,5956
## 64         60000           61100              SAN MIGUEL 0,5787   96,5258
## 65         60000           61200               SAN PABLO 0,5587   96,9911
## 66         60000           61300              SANTA CRUZ 0,5349   96,0784
## 67         70000           70100                  CALLAO 0,8514   99,4939
## 68         80000           80100                   CUSCO 0,8762   97,8854
## 69         80000           80200                 ACOMAYO 0,6331    97,199
## 70         80000           80300                    ANTA 0,6379   97,9755
## 71         80000           80400                   CALCA 0,6321    96,954
## 72         80000           80500                   CANAS  0,568   98,3403
## 73         80000           80600                 CANCHIS 0,7344    97,838
## 74         80000           80700            CHUMBIVILCAS 0,5329   97,8608
## 75         80000           80800                 ESPINAR 0,6109   98,7317
## 76         80000           80900           LA CONVENCION 0,6069   96,3227
## 77         80000           81000                  PARURO 0,5573   97,6097
## 78         80000           81100             PAUCARTAMBO 0,5599   96,7844
## 79         80000           81200            QUISPICANCHI  0,618   97,6088
## 80         80000           81300                URUBAMBA 0,7234   96,0675
## 81         90000           90100            HUANCAVELICA 0,6477   98,9226
## 82         90000           90200                ACOBAMBA 0,5771   98,7516
## 83         90000           90300                ANGARAES 0,5913    98,439
## 84         90000           90400          CASTROVIRREYNA 0,5652   98,0852
## 85         90000           90500               CHURCAMPA 0,5615   97,9364
## 86         90000           90600                HUAYTARA 0,5709   97,4424
## 87         90000           90700                TAYACAJA 0,5827   97,2705
## 88        100000          100100                 HUANUCO 0,7179   97,4669
## 89        100000          100200                    AMBO 0,5594   97,9204
## 90        100000          100300             DOS DE MAYO 0,5822   96,8027
## 91        100000          100400             HUACAYBAMBA 0,5826   96,5215
## 92        100000          100500               HUAMALIES 0,5598   94,9934
## 93        100000          100600           LEONCIO PRADO 0,6803   95,4785
## 94        100000          100700                 MARANON  0,477   96,8355
## 95        100000          100800                PACHITEA 0,4821   94,7089
## 96        100000          100900             PUERTO INCA 0,4807   90,0761
## 97        100000          101000              LAURICOCHA 0,5554   96,3078
## 98        100000          101100               YAROWILCA 0,5294   98,2606
## 99        110000          110100                     ICA  0,845   99,5035
## 100       110000          110200                 CHINCHA 0,7622   99,4989
## 101       110000          110300                   NAZCA 0,7812   99,3843
## 102       110000          110400                   PALPA  0,775   99,3064
## 103       110000          110500                   PISCO 0,7092   99,2571
## 104       120000          120100                HUANCAYO 0,8151   98,8701
## 105       120000          120200              CONCEPCION 0,6705   97,8206
## 106       120000          120300             CHANCHAMAYO 0,6428   97,5518
## 107       120000          120400                   JAUJA 0,7053   98,0137
## 108       120000          120500                   JUNIN 0,6267   98,9176
## 109       120000          120600                  SATIPO 0,5807   96,1116
## 110       120000          120700                   TARMA 0,7105   98,8506
## 111       120000          120800                   YAULI 0,7727      99,5
## 112       120000          120900                 CHUPACA 0,6888   97,8224
## 113       130000          130100                TRUJILLO  0,888   99,3464
## 114       130000          130200                  ASCOPE 0,7553      99,5
## 115       130000          130300                 BOLIVAR 0,5894   96,7847
## 116       130000          130400                  CHEPEN  0,757    99,096
## 117       130000          130500                  JULCAN 0,5272   97,7276
## 118       130000          130600                  OTUZCO 0,5877   97,0273
## 119       130000          130700               PACASMAYO 0,7841    99,301
## 120       130000          130800                   PATAZ 0,6038   95,7538
## 121       130000          130900         SANCHEZ CARRION 0,4838    96,212
## 122       130000          131000       SANTIAGO DE CHUCO 0,5667   98,0769
## 123       130000          131100              GRAN CHIMU 0,5843   97,0097
## 124       130000          131200                    VIRU 0,6949   98,3704
## 125       140000          140100                CHICLAYO 0,8317   98,4564
## 126       140000          140200               FERRENAFE 0,6891   96,8825
## 127       140000          140300              LAMBAYEQUE 0,6604    97,899
## 128       150000          150100                    LIMA 0,8999   99,3591
## 129       150000          150200                BARRANCA 0,8118    99,295
## 130       150000          150300               CAJATAMBO 0,6624    97,773
## 131       150000          150400                   CANTA 0,6628   98,6936
## 132       150000          150500                  CANETE 0,7697   99,5034
## 133       150000          150600                  HUARAL  0,777   99,0524
## 134       150000          150700              HUAROCHIRI 0,7134   99,0322
## 135       150000          150800                  HUAURA 0,7884   99,4633
## 136       150000          150900                    OYON 0,7104   99,0082
## 137       150000          151000                  YAUYOS 0,6657   98,4199
## 138       160000          160100                  MAYNAS 0,6779   95,9809
## 139       160000          160200           ALTO AMAZONAS 0,5685   94,0398
## 140       160000          160300                  LORETO  0,507   89,8845
## 141       160000          160400 MARISCAL RAMON CASTILLA 0,4707   91,3034
## 142       160000          160500                 REQUENA 0,5378   92,4981
## 143       160000          160600                 UCAYALI 0,5572   90,6369
## 144       160000          160700       DATEM DEL MARANON 0,4295   81,9682
## 145       170000          170100               TAMBOPATA 0,8027   99,2041
## 146       170000          170200                    MANU 0,5941   93,5355
## 147       170000          170300               TAHUAMANU 0,7263      99,5
## 148       180000          180100          MARISCAL NIETO 0,8263   99,4366
## 149       180000          180200   GENERAL SANCHEZ CERRO 0,6417   98,8706
## 150       180000          180300                     ILO 0,8504      99,5
## 151       190000          190100                   PASCO 0,7169      99,5
## 152       190000          190200  DANIEL ALCIDES CARRION 0,6271      99,5
## 153       190000          190300                OXAPAMPA 0,5744   94,7617
## 154       200000          200100                   PIURA 0,7426   98,5621
## 155       200000          200200                 AYABACA 0,5102   94,8213
## 156       200000          200300             HUANCABAMBA 0,5334   94,1863
## 157       200000          200400                MORROPON 0,6653   97,1181
## 158       200000          200500                   PAITA 0,7154   99,2638
## 159       200000          200600                 SULLANA 0,7548   97,9271
## 160       200000          200700                  TALARA 0,8082   99,0036
## 161       200000          200800                 SECHURA 0,6745   97,9712
## 162       210000          210100                    PUNO 0,7483   98,9834
## 163       210000          210200                AZANGARO 0,5716   98,7557
## 164       210000          210300                CARABAYA 0,6022   98,2289
## 165       210000          210400                CHUCUITO 0,6036   98,6818
## 166       210000          210500               EL COLLAO 0,6141    99,407
## 167       210000          210600                HUANCANE 0,5866     98,59
## 168       210000          210700                   LAMPA 0,5839   99,3094
## 169       210000          210800                  MELGAR 0,6322   99,0987
## 170       210000          210900                    MOHO 0,6098   98,1119
## 171       210000          211000   SAN ANTONIO DE PUTINA 0,5691   98,8164
## 172       210000          211100               SAN ROMAN 0,7813   99,0267
## 173       210000          211200                  SANDIA 0,6152   98,5936
## 174       210000          211300                 YUNGUYO 0,6807   98,3785
## 175       220000          220100               MOYOBAMBA 0,6832   95,7572
## 176       220000          220200              BELLAVISTA 0,6256   94,1988
## 177       220000          220300               EL DORADO 0,6066   96,8349
## 178       220000          220400                HUALLAGA   0,66   96,7308
## 179       220000          220500                   LAMAS 0,6051    96,557
## 180       220000          220600        MARISCAL CACERES 0,6922   96,0263
## 181       220000          220700                  PICOTA 0,6884   96,1658
## 182       220000          220800                   RIOJA 0,6672   95,4084
## 183       220000          220900              SAN MARTIN 0,8285   98,3258
## 184       220000          221000                 TOCACHE 0,6456   94,9457
## 185       230000          230100                   TACNA 0,9104   99,4928
## 186       230000          230200               CANDARAVE 0,6521      99,5
## 187       230000          230300           JORGE BASADRE 0,8487      99,5
## 188       230000          230400                  TARATA 0,7414   99,3157
## 189       240000          240100                  TUMBES 0,7622   99,1184
## 190       240000          240200   CONTRALMIRANTE VILLAR 0,6659   99,1872
## 191       240000          240300               ZARUMILLA 0,6849   97,4754
## 192       250000          250100        CORONEL PORTILLO  0,667   97,5922
## 193       250000          250200                 ATALAYA 0,4245   84,2895
## 194       250000          250300              PADRE ABAD 0,5023   97,3087
## 195       250000          250400                   PURUS 0,4473   91,9667
##       salud educacion saneamiento electrificacion poblacion costa capital
## 1     25,45   91,4986     70,3454         83,9712     54783    NO      SI
## 2   14,6091   79,7902      64,479         67,9146     77438    NO      NO
## 3    9,0102    76,424     54,8341         72,1693     32317    NO      NO
## 4     8,557   52,2149     37,7145         39,4891     51802    NO      NO
## 5    12,418    74,726     43,3484         67,3961     52185    NO      NO
## 6   14,8787   79,4244     46,5018         67,5461     30236    NO      NO
## 7   10,1102   77,1683     52,5195         63,1177    118747    NO      NO
## 8   21,8066   95,0063     82,9326         93,1496    161003    NO      SI
## 9     8,594   89,4989     47,7841          79,122      7974    NO      NO
## 10   4,9923   77,7374     48,9181         73,8765     16879    NO      NO
## 11   17,189   81,5383     67,1184         74,2923      9013    NO      NO
## 12   9,4165   85,2385      61,385         79,1416     32452    NO      NO
## 13  10,2247    72,057     73,2979         86,9098     46434    NO      NO
## 14   9,0871   59,7295     29,4336         47,7474     21920    NO      NO
## 15  10,0441   89,7711     81,9572          87,877     46032    SI      NO
## 16  11,3027   78,1769     61,6929         80,1392      8340    NO      NO
## 17   14,087   76,3536     60,0936         80,0751     63726    NO      NO
## 18  13,3628   95,5122     75,2566         87,6444     29972    SI      NO
## 19  14,3251   63,7338      69,345         76,4138     56102    NO      NO
## 20    5,202    69,084     31,2854         53,7286     23888    NO      NO
## 21   7,4294   93,4748     42,7468          71,765     10283    NO      NO
## 22   9,7786   75,6362       44,66         74,9557     30536    NO      NO
## 23  14,5264    63,921      49,764         54,9378     29196    NO      NO
## 24  10,2591   90,2889     73,4154         76,9919     19509    NO      NO
## 25  19,7013   96,4346     88,6281         96,2817    427157    SI      NO
## 26  12,0564   69,5418     43,0137         75,1775     31006    NO      NO
## 27  10,2298    62,354     67,3776         68,3959     57969    NO      NO
## 28  16,9311   93,6909     63,0011         90,5064    105694    NO      SI
## 29  12,4028   83,7088      72,297         83,9755    163662    NO      NO
## 30   5,3211    91,055     25,2835         63,6509     13399    NO      NO
## 31   4,9546   92,2419     34,5556         72,9106     32722    NO      NO
## 32   6,0624   74,0475      33,988         57,4942     51667    NO      NO
## 33   7,1636    81,505     53,1857         67,3993     57750    NO      NO
## 34   8,5845   82,4632     27,8333         71,1088     26987    NO      NO
## 35  40,4944   93,4114     95,5408         97,8951    936464    NO      SI
## 36  21,3335   90,3838     82,9674          82,893     57187    SI      NO
## 37  17,5497   80,9079     63,4413         75,1853     39317    SI      NO
## 38  12,3108   82,4863      85,132         83,6063     38990    NO      NO
## 39  10,9773   84,3677     58,4541         71,3575     86542    NO      NO
## 40   12,945   83,2657     64,6445         55,2726     18540    NO      NO
## 41  18,6627   94,2023     92,6318           92,52     53047    SI      NO
## 42  19,7837   71,4648     61,8834         53,1603     15164    NO      NO
## 43  19,1627   83,5629     74,3072         90,3163    261382    NO      SI
## 44  10,6072   70,7635     45,1408         51,9452     34298    NO      NO
## 45  10,4056   85,4506     26,8577         56,9772     10472    NO      NO
## 46   7,8265   72,0394     50,3193         64,8231    102619    NO      NO
## 47   5,9239   61,5692     30,5293         47,0695     87160    NO      NO
## 48  10,0509   91,0306     36,7625         65,8977     67167    NO      NO
## 49  13,4073   83,9144     43,3083         74,5507     32023    NO      NO
## 50  14,4225   93,9172     54,0318          87,283     11028    NO      NO
## 51  12,7053   86,8535     38,4042         69,6481     12255    NO      NO
## 52   8,7686   77,8064     46,8821         69,3787     24213    NO      NO
## 53   7,8826    72,025     45,8992         37,2551     23412    NO      NO
## 54  15,7259   86,1347     76,1244          87,531    368639    NO      SI
## 55   6,2862   66,8311     63,4764          62,887     80086    NO      NO
## 56   6,3241   68,4681     57,1751         61,9291     95433    NO      NO
## 57   6,9577    79,134     41,0023         65,2231    167670    NO      NO
## 58   8,5074   89,5479     51,3358         64,3249     32602    NO      NO
## 59  10,0209   72,5216     36,2101         50,5428    143667    NO      NO
## 60   6,0375   71,3687     51,6709         51,3883    100009    NO      NO
## 61  10,8123   83,2315     44,7478         76,7748    198354    NO      NO
## 62   5,6695   76,5965     47,2578          59,029    145478    NO      NO
## 63   4,4653    69,885     66,3363         50,9721     54622    NO      NO
## 64   6,9082    85,777     48,1129         47,3965     57492    NO      NO
## 65   3,7146   75,1291      55,086         45,9765     23885    NO      NO
## 66   6,7198   87,9763       13,79         58,3943     45955    NO      NO
## 67  26,4218   89,8493     93,0432         99,2529    969170    SI      SI
## 68  30,5147      99,5     90,3696            99,5    427580    NO      SI
## 69  10,4537   83,1267     48,2393         70,5703     28318    NO      NO
## 70   4,6273   82,8919     43,5397         86,8348     57262    NO      NO
## 71   6,3367    77,724     52,6436         78,1668     72583    NO      NO
## 72   5,3289   84,5397     34,0964          58,153     39973    NO      NO
## 73  10,8021   92,7148     70,1059         88,5203    102826    NO      NO
## 74   6,0491   76,0087     39,4397         43,0746     81878    NO      NO
## 75   8,9812   88,4132     45,8511         57,4631     68390    NO      NO
## 76   9,2718   84,7681     40,9197         66,0037    179515    NO      NO
## 77   4,8544   74,8891     41,1514         56,9302     31521    NO      NO
## 78   6,1349   59,7834     46,3203         66,8591     50323    NO      NO
## 79   4,9016   74,7613     52,6529         75,8022     88967    NO      NO
## 80  11,1369   89,0927     59,2273         98,7497     63039    NO      NO
## 81   8,4463   83,9779     40,4136         86,4489    153773    NO      SI
## 82   2,6282   77,5408     31,1721         76,7208     73243    NO      NO
## 83    3,004   76,8243     36,9268         78,4647     60816    NO      NO
## 84   4,7333      99,5     20,8772         56,2698     19500    NO      NO
## 85   3,7926   75,4469     25,9138         75,1098     45172    NO      NO
## 86   6,9062   93,0713      24,043          59,383     23361    NO      NO
## 87   4,6864     77,79     28,8652         79,6273    107715    NO      NO
## 88  21,9022   84,4585     65,5353         74,9612    301396    NO      SI
## 89  11,1829   74,8834     25,5836         62,6859     57957    NO      NO
## 90  13,0303   74,0063     49,4522         49,1357     52025    NO      NO
## 91   6,5479   66,9303     53,1725         63,7385     22403    NO      NO
## 92  11,3609   75,2894      41,526         49,1445     73621    NO      NO
## 93  18,5407   91,4246     51,5353         70,8055    129953    NO      NO
## 94   6,7634   64,0645     23,8282         42,5136     30594    NO      NO
## 95    8,922   52,4708     35,9075         43,0686     69003    NO      NO
## 96  13,7197   68,0194     25,5408         33,8304     32060    NO      NO
## 97  11,2596   82,0013     36,3976         44,2322     38257    NO      NO
## 98   9,5985   76,9046     31,8684         41,6769     33715    NO      NO
## 99  30,0232   87,7433      94,266         90,9563    349036    SI      SI
## 100 16,2647   84,4472     83,1503         86,8764    210098    SI      NO
## 101 18,7779    87,539     84,1663         88,2205     58817    SI      NO
## 102  18,157   85,4934     91,1803         81,2415     12621    NO      NO
## 103 13,8738   84,8986      70,459         76,8762    132986    SI      NO
## 104 20,3101   94,5642     85,4177         94,8395    497299    NO      SI
## 105  6,3452   85,5002     58,1659         83,1976     58942    NO      NO
## 106  8,1031   80,7343     58,9306          70,703    193140    NO      NO
## 107 10,3796   90,8331     55,8857         90,6086     88524    NO      NO
## 108 12,5177   88,0828     23,2858         82,1882     27722    NO      NO
## 109  5,1873   72,4222     51,8365         61,3319    244727    NO      NO
## 110 10,9357   84,8047     62,1884         91,1852    111631    NO      NO
## 111 12,4015   99,0315     75,5876          91,573     45858    NO      NO
## 112  6,7123   93,7842     58,9627         82,6588     53564    NO      NO
## 113 32,9186   95,7003     98,0614         96,0229    914036    SI      SI
## 114  17,602   96,5098     65,4569         86,8584    120884    SI      NO
## 115 17,0746   59,0046     51,4671         58,9619     16910    NO      NO
## 116 13,0308   92,1739     84,7516         80,7373     84037    SI      NO
## 117  9,0297   60,0022     54,2229         36,6195     32400    NO      NO
## 118 11,9985   59,9136     61,6578          55,241     92237    NO      NO
## 119 15,9519   93,8715     82,1331         90,1695    101954    SI      NO
## 120 11,8223   61,6108     58,1123         66,7366     85687    NO      NO
## 121   8,273   48,1215     39,5255         44,2572    149616    NO      NO
## 122 11,9058   68,7819     45,5874         51,0685     61329    NO      NO
## 123 10,7215    67,204     66,2424         43,8284     31402    NO      NO
## 124  5,9394   74,0766     84,9306         80,1798    101167    SI      NO
## 125 25,7449   88,9529     86,0233            99,5    836299    SI      SI
## 126 14,0778   73,4821     76,3114         74,4212    104820    NO      NO
## 127  8,3964   72,9188     73,0946         72,3053    288141    SI      NO
## 128 38,3657   89,5797     97,5604            99,5   8481415    SI      SI
## 129 21,4062   83,9918     96,9944         89,9645    143216    SI      NO
## 130 16,2382   78,1014     51,6375          76,623      8139    NO      NO
## 131 29,0179   76,8965     39,9944         67,4349     14669    NO      NO
## 132 16,3725   86,2599     86,3501         85,4381    222877    SI      NO
## 133 17,7469   84,0086     85,1771         90,6684    182409    SI      NO
## 134 16,2867   81,9827     73,6597         74,8972     79177    NO      NO
## 135  22,032   84,1302      85,147         88,7237    213188    SI      NO
## 136  9,4051   77,9139     77,8538           84,76     22217    NO      NO
## 137 14,4953   83,6558     52,3377         74,2986     27842    NO      NO
## 138 12,4254   79,0188     57,2983         85,9357    550031    NO      SI
## 139  10,814   61,7112     44,4909         66,0007    117163    NO      NO
## 140  6,2437   60,1239      32,464          60,621     69508    NO      NO
## 141  4,5533   55,2372     23,2198         58,0174     67143    NO      NO
## 142  4,9098    64,907     27,0976         76,2223     72706    NO      NO
## 143  4,5009   71,0551     33,5148         75,8978     70782    NO      NO
## 144  4,7538   44,0338     32,0778         48,7369     59620    NO      NO
## 145 26,2887   86,1364     84,2227         87,9527     91988    NO      SI
## 146 12,1582   81,1164     37,0703         65,0632     22906    NO      NO
## 147 27,4945   82,3381     56,4859         79,0064     12745    NO      NO
## 148 26,9476   94,0548     80,8463         93,9171     78890    NO      SI
## 149 13,2708   86,5558     38,3928         74,9002     27275    NO      NO
## 150 21,2476   91,3031        99,5            99,5     68694    SI      NO
## 151 10,7282   94,3146     58,5859         88,1771    156259    NO      SI
## 152  4,6297   95,0075     41,9339         69,4167     51789    NO      NO
## 153 12,5667   65,4202     42,7355         63,3166     89543    NO      NO
## 154 15,3145    89,086     77,9517         80,1926    734437    SI      SI
## 155  3,6732   60,0579     51,9557         42,1461    141708    NO      NO
## 156  5,6703   65,4099     56,4812         41,1786    127423    NO      NO
## 157  7,3392   80,9296     67,5797         74,8067    159486    NO      NO
## 158  6,7769   85,3579     76,5216         85,2715    122725    SI      NO
## 159 12,9206   91,7215     78,0363         88,1845    309605    NO      NO
## 160 17,2074   97,9404     84,5123         93,9844    133148    SI      NO
## 161  5,9599     79,84      72,387          77,137     71075    NO      NO
## 162 18,5388    93,596     64,1132         86,5741    244692    NO      SI
## 163  2,9063    81,044     39,6135         61,5461    139092    NO      NO
## 164  4,6188   74,6275     52,4479         68,1171     87812    NO      NO
## 165  3,6953   88,2616     37,3401         71,3466    142711    NO      NO
## 166  4,2362    92,492     34,7087         73,3596     84865    NO      NO
## 167    6,42   86,7475       33,66         63,5913     67726    NO      NO
## 168  5,6917   83,7246     39,5906         59,8291     51039    NO      NO
## 169   6,044   81,0894     60,8358         65,0074     77355    NO      NO
## 170   2,598   83,4812     45,2047         73,7554     26799    NO      NO
## 171    2,64   88,4295     29,5768         63,3287     62247    NO      NO
## 172  15,507   94,0194     72,2405            99,5    276352    NO      NO
## 173  6,4219   84,2576     50,2309         63,8324     68253    NO      NO
## 174  6,8712    87,114     52,7099         90,6861     48179    NO      NO
## 175  9,9368   83,2734     72,5388         73,4589    136414    NO      SI
## 176   7,979   76,7049     59,9836         68,6068     55815    NO      NO
## 177  7,7403   66,9119     68,0806         58,5684     38152    NO      NO
## 178 11,4771   78,1732     74,7704         61,2204     25357    NO      NO
## 179  6,3469   72,5867     61,5244          61,297     83825    NO      NO
## 180   9,981   85,2023     75,5526         72,7025     51489    NO      NO
## 181  7,8023   82,3184     73,9773         78,7176     42369    NO      NO
## 182 10,3815    83,083     58,2882         79,4966    120387    NO      NO
## 183 21,3298      99,5     85,3935         95,5041    179184    NO      NO
## 184 10,5095   92,4323     43,6077         74,3133     73460    NO      NO
## 185 44,7413   90,0518     95,8766         95,2144    302852    SI      SI
## 186  7,1132   90,0467     40,1112          84,534      8435    NO      NO
## 187 30,0799   97,3276     83,9754         93,4183      9641    SI      NO
## 188 22,5366    90,173     68,7254         74,9025      7987    NO      NO
## 189  18,382   86,2661     77,6778         87,4196    159548    SI      SI
## 190  6,6236   81,4642     59,7919         81,4494     19180    SI      NO
## 191  6,9758   81,2087     71,0227         81,1197     49499    SI      NO
## 192 12,5195   85,4286     42,8511         86,7715    366040    NO      SI
## 193  4,5206   55,4652     13,2425         51,7253     50569    NO      NO
## 194  4,4984   73,2013      13,243         59,8946     56756    NO      NO
## 195 15,9542   51,3878      0,2351         53,4704      4251    NO      NO
##          tamano
## 1       Pequena
## 2       Pequena
## 3   Muy pequena
## 4       Pequena
## 5       Pequena
## 6   Muy pequena
## 7       Mediana
## 8       Mediana
## 9   Muy pequena
## 10  Muy pequena
## 11  Muy pequena
## 12  Muy pequena
## 13  Muy pequena
## 14  Muy pequena
## 15  Muy pequena
## 16  Muy pequena
## 17      Pequena
## 18  Muy pequena
## 19      Pequena
## 20  Muy pequena
## 21  Muy pequena
## 22  Muy pequena
## 23  Muy pequena
## 24  Muy pequena
## 25       Grande
## 26  Muy pequena
## 27      Pequena
## 28      Mediana
## 29      Mediana
## 30  Muy pequena
## 31  Muy pequena
## 32      Pequena
## 33      Pequena
## 34  Muy pequena
## 35       Grande
## 36      Pequena
## 37  Muy pequena
## 38  Muy pequena
## 39      Pequena
## 40  Muy pequena
## 41      Pequena
## 42  Muy pequena
## 43      Mediana
## 44  Muy pequena
## 45  Muy pequena
## 46      Mediana
## 47      Pequena
## 48      Pequena
## 49  Muy pequena
## 50  Muy pequena
## 51  Muy pequena
## 52  Muy pequena
## 53  Muy pequena
## 54       Grande
## 55      Pequena
## 56      Pequena
## 57      Mediana
## 58  Muy pequena
## 59      Mediana
## 60      Mediana
## 61      Mediana
## 62      Mediana
## 63      Pequena
## 64      Pequena
## 65  Muy pequena
## 66  Muy pequena
## 67       Grande
## 68       Grande
## 69  Muy pequena
## 70      Pequena
## 71      Pequena
## 72  Muy pequena
## 73      Mediana
## 74      Pequena
## 75      Pequena
## 76      Mediana
## 77  Muy pequena
## 78      Pequena
## 79      Pequena
## 80      Pequena
## 81      Mediana
## 82      Pequena
## 83      Pequena
## 84  Muy pequena
## 85  Muy pequena
## 86  Muy pequena
## 87      Mediana
## 88       Grande
## 89      Pequena
## 90      Pequena
## 91  Muy pequena
## 92      Pequena
## 93      Mediana
## 94  Muy pequena
## 95      Pequena
## 96  Muy pequena
## 97  Muy pequena
## 98  Muy pequena
## 99       Grande
## 100     Mediana
## 101     Pequena
## 102 Muy pequena
## 103     Mediana
## 104      Grande
## 105     Pequena
## 106     Mediana
## 107     Pequena
## 108 Muy pequena
## 109     Mediana
## 110     Mediana
## 111 Muy pequena
## 112     Pequena
## 113      Grande
## 114     Mediana
## 115 Muy pequena
## 116     Pequena
## 117 Muy pequena
## 118     Pequena
## 119     Mediana
## 120     Pequena
## 121     Mediana
## 122     Pequena
## 123 Muy pequena
## 124     Mediana
## 125      Grande
## 126     Mediana
## 127     Mediana
## 128  Muy grande
## 129     Mediana
## 130 Muy pequena
## 131 Muy pequena
## 132     Mediana
## 133     Mediana
## 134     Pequena
## 135     Mediana
## 136 Muy pequena
## 137 Muy pequena
## 138      Grande
## 139     Mediana
## 140     Pequena
## 141     Pequena
## 142     Pequena
## 143     Pequena
## 144     Pequena
## 145     Pequena
## 146 Muy pequena
## 147 Muy pequena
## 148     Pequena
## 149 Muy pequena
## 150     Pequena
## 151     Mediana
## 152     Pequena
## 153     Pequena
## 154      Grande
## 155     Mediana
## 156     Mediana
## 157     Mediana
## 158     Mediana
## 159      Grande
## 160     Mediana
## 161     Pequena
## 162     Mediana
## 163     Mediana
## 164     Pequena
## 165     Mediana
## 166     Pequena
## 167     Pequena
## 168     Pequena
## 169     Pequena
## 170 Muy pequena
## 171     Pequena
## 172     Mediana
## 173     Pequena
## 174 Muy pequena
## 175     Mediana
## 176     Pequena
## 177 Muy pequena
## 178 Muy pequena
## 179     Pequena
## 180     Pequena
## 181 Muy pequena
## 182     Mediana
## 183     Mediana
## 184     Pequena
## 185      Grande
## 186 Muy pequena
## 187 Muy pequena
## 188 Muy pequena
## 189     Mediana
## 190 Muy pequena
## 191 Muy pequena
## 192      Grande
## 193     Pequena
## 194     Pequena
## 195 Muy pequena
str(datos)
## 'data.frame':    195 obs. of  13 variables:
##  $ regionUbigeo   : int  10000 10000 10000 10000 10000 10000 10000 20000 20000 20000 ...
##  $ provinciaUbigeo: int  10100 10200 10300 10400 10500 10600 10700 20100 20200 20300 ...
##  $ PROVINCIA      : chr  "CHACHAPOYAS" "BAGUA" "BONGARA" "CONDORCANQUI" ...
##  $ IDE            : chr  "0,7737" "0,6623" "0,6318" "0,4598" ...
##  $ identidad      : chr  "98,6179" "94,6079" "97,4681" "86,232" ...
##  $ salud          : chr  "25,45" "14,6091" "9,0102" "8,557" ...
##  $ educacion      : chr  "91,4986" "79,7902" "76,424" "52,2149" ...
##  $ saneamiento    : chr  "70,3454" "64,479" "54,8341" "37,7145" ...
##  $ electrificacion: chr  "83,9712" "67,9146" "72,1693" "39,4891" ...
##  $ poblacion      : int  54783 77438 32317 51802 52185 30236 118747 161003 7974 16879 ...
##  $ costa          : chr  "NO" "NO" "NO" "NO" ...
##  $ capital        : chr  "SI" "NO" "NO" "NO" ...
##  $ tamano         : chr  "Pequena" "Pequena" "Muy pequena" "Pequena" ...
library(readr)

datos[,c(4:9)]=lapply(datos[,c(4:9)],parse_number)
str(datos)
## 'data.frame':    195 obs. of  13 variables:
##  $ regionUbigeo   : int  10000 10000 10000 10000 10000 10000 10000 20000 20000 20000 ...
##  $ provinciaUbigeo: int  10100 10200 10300 10400 10500 10600 10700 20100 20200 20300 ...
##  $ PROVINCIA      : chr  "CHACHAPOYAS" "BAGUA" "BONGARA" "CONDORCANQUI" ...
##  $ IDE            : num  7737 6623 6318 4598 6047 ...
##  $ identidad      : num  986179 946079 974681 86232 961927 ...
##  $ salud          : num  2545 146091 90102 8557 12418 ...
##  $ educacion      : num  914986 797902 76424 522149 74726 ...
##  $ saneamiento    : num  703454 64479 548341 377145 433484 ...
##  $ electrificacion: num  839712 679146 721693 394891 673961 ...
##  $ poblacion      : int  54783 77438 32317 51802 52185 30236 118747 161003 7974 16879 ...
##  $ costa          : chr  "NO" "NO" "NO" "NO" ...
##  $ capital        : chr  "SI" "NO" "NO" "NO" ...
##  $ tamano         : chr  "Pequena" "Pequena" "Muy pequena" "Pequena" ...

Analizo la dependiente.

NORMALIDAD: SHAPIRO WILK

shapiro.test(datos$identidad)
## 
##  Shapiro-Wilk normality test
## 
## data:  datos$identidad
## W = 0.52227, p-value < 2.2e-16
A=lm(identidad~salud+ educacion+ saneamiento+electrificacion+poblacion+costa+capital+tamano,data=datos)

summary(A)
## 
## Call:
## lm(formula = identidad ~ salud + educacion + saneamiento + electrificacion + 
##     poblacion + costa + capital + tamano, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -905691   20356  129931  193114  360597 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        9.269e+05  2.411e+05   3.845 0.000166 ***
## salud             -5.905e-01  4.246e-01  -1.391 0.165996    
## educacion         -1.149e-01  9.121e-02  -1.260 0.209185    
## saneamiento       -1.469e-02  1.191e-01  -0.123 0.902009    
## electrificacion    1.799e-01  1.005e-01   1.791 0.074995 .  
## poblacion          2.242e-01  3.512e-01   0.638 0.524088    
## costaSI           -1.148e+05  8.028e+04  -1.430 0.154363    
## capitalSI          1.141e+05  1.109e+05   1.029 0.304912    
## tamanoMediana     -1.476e+05  1.796e+05  -0.822 0.412323    
## tamanoMuy grande  -1.490e+06  2.795e+06  -0.533 0.594555    
## tamanoMuy pequena -5.475e+04  2.144e+05  -0.255 0.798710    
## tamanoPequena     -1.481e+05  2.034e+05  -0.728 0.467519    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 344200 on 183 degrees of freedom
## Multiple R-squared:  0.08821,    Adjusted R-squared:  0.0334 
## F-statistic: 1.609 on 11 and 183 DF,  p-value: 0.09908
B=lm(salud~identidad+ educacion+ saneamiento+electrificacion+poblacion+costa+capital+tamano,data=datos)

summary(B)
## 
## Call:
## lm(formula = salud ~ identidad + educacion + saneamiento + electrificacion + 
##     poblacion + costa + capital + tamano, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -169697  -34471   -7018   32612  194280 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)   
## (Intercept)        1.157e+05  4.255e+04   2.720  0.00716 **
## identidad         -1.771e-02  1.274e-02  -1.391  0.16600   
## educacion          5.808e-03  1.586e-02   0.366  0.71464   
## saneamiento        4.710e-02  2.034e-02   2.316  0.02167 * 
## electrificacion    1.908e-02  1.750e-02   1.091  0.27692   
## poblacion          3.141e-02  6.085e-02   0.516  0.60634   
## costaSI            3.950e+04  1.367e+04   2.889  0.00433 **
## capitalSI          6.086e+04  1.872e+04   3.250  0.00137 **
## tamanoMediana     -7.375e+04  3.069e+04  -2.403  0.01726 * 
## tamanoMuy grande  -1.324e+05  4.844e+05  -0.273  0.78485   
## tamanoMuy pequena -3.899e+04  3.702e+04  -1.053  0.29371   
## tamanoPequena     -6.643e+04  3.493e+04  -1.902  0.05876 . 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 59610 on 183 degrees of freedom
## Multiple R-squared:  0.4564, Adjusted R-squared:  0.4237 
## F-statistic: 13.97 on 11 and 183 DF,  p-value: < 2.2e-16

SANEAMIENTO - COSTA (NUM-CAT)

JAJA= formula (saneamiento ~ costa)

aggregate (JAJA, datos, median)
##   costa saneamiento
## 1    NO    477841.0
## 2    SI    830588.5
library(knitr)
san= aggregate(JAJA, datos,
          FUN = function(x) {y <- shapiro.test(x); c(y$statistic, y$p.value)})

# para que se vea mejor:
library(knitr)

shapiroTest=as.data.frame(san[,2])
names(shapiroTest)=c("W","Prob")

kable(cbind(san[1],shapiroTest))
costa W Prob
NO 0.9753667 0.0052318
SI 0.7074454 0.0000011
library(ggpubr)

ggqqplot(data= datos, x="saneamiento") + facet_grid(. ~ costa)

camino NO PARAMÉTRICO.

wilcox.test(JAJA,datos)
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  saneamiento by costa
## W = 869, p-value = 2.582e-09
## alternative hypothesis: true location shift is not equal to 0

EL P-VALUE ES SIGNIFICATIVO, SE RECHAZA LA HIPÓTESIS. POR LO TANTO, HAY DIFERENCIA DE MEDIAS.

ggplot(data=datos, aes(x=costa, y=saneamiento)) + geom_boxplot(notch = T)
## notch went outside hinges. Try setting notch=FALSE.

Se comprueba la diferencia.