Exploración Indice de Desarrollo Humano

Raul Salinas

link='https://docs.google.com/spreadsheets/d/e/2PACX-1vR57SI7l8mOD57sc7lfhoQU7kz6Q8tKsXrg5MIwN-H80FonDkyhd90WeRtC4zNsx4LLurM34FdRlrYv/pub?gid=306296306&single=true&output=csv'
indice=read.csv(link, stringsAsFactors = F)
indice
##                X X1993 X2000 X2007 X2012
## 1       Amazonas  0.47  0.52  0.57  0.38
## 2         Ancash  0.53  0.58  0.60  0.44
## 3       Apurímac  0.40  0.46  0.56  0.34
## 4       Arequipa  0.65  0.64  0.65  0.58
## 5       Ayacucho  0.42  0.49  0.56  0.33
## 6      Cajamarca  0.45  0.50  0.56  0.38
## 7          Cusco  0.48  0.54  0.58  0.44
## 8   Huancavelica  0.37  0.46  0.54  0.30
## 9        Huánuco  0.45  0.49  0.57  0.37
## 10           Ica  0.64  0.67  0.65  0.54
## 11         Junín  0.54  0.58  0.60  0.45
## 12   La Libertad  0.58  0.61  0.62  0.47
## 13    Lambayeque  0.59  0.63  0.62  0.46
## 14          Lima  0.75  0.75  0.68  0.63
## 15        Loreto  0.53  0.56  0.59  0.40
## 16 Madre de Dios  0.60  0.62  0.63  0.56
## 17      Moquegua  0.62  0.67  0.65  0.62
## 18         Pasco  0.52  0.58  0.59  0.41
## 19         Piura  0.53  0.55  0.60  0.43
## 20          Puno  0.45  0.51  0.56  0.39
## 21    San Martin  0.54  0.55  0.59  0.44
## 22         Tacna  0.71  0.68  0.65  0.56
## 23        Tumbes  0.61  0.62  0.65  0.52
## 24       Ucayali  0.52  0.57  0.60  0.43
str(indice)
## 'data.frame':    24 obs. of  5 variables:
##  $ X    : chr  "Amazonas" "Ancash" "Apurímac" "Arequipa" ...
##  $ X1993: num  0.47 0.53 0.4 0.65 0.42 0.45 0.48 0.37 0.45 0.64 ...
##  $ X2000: num  0.52 0.58 0.46 0.64 0.49 0.5 0.54 0.46 0.49 0.67 ...
##  $ X2007: num  0.57 0.6 0.56 0.65 0.56 0.56 0.58 0.54 0.57 0.65 ...
##  $ X2012: num  0.38 0.44 0.34 0.58 0.33 0.38 0.44 0.3 0.37 0.54 ...
library(ggplot2)
base1=ggplot(indice,aes(x=X1993))
histNum= base1 + geom_histogram(bins=7) 
histNum 

base2=ggplot(indice,aes(y=X1993))
box=base2 + geom_boxplot() + coord_flip()

box

summary(indice$X1993)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.3700  0.4650  0.5300  0.5396  0.6025  0.7500

Obtenemos la mediana (0.53) y la mediana (0.5396)

library(psych)
## 
## Attaching package: 'psych'
## The following objects are masked from 'package:ggplot2':
## 
##     %+%, alpha
skew(indice$X1993)
## [1] 0.2789678

Así obtenemos el coeficiente de simetría, que señala una simetría positiva.

kurtosi(indice$X1993)
## [1] -0.6293588

Aquí el coeficiente de custosis nos indica una curva platicúrtica.

var(indice$X1993)
## [1] 0.009169384

Esto nos indica la varianza.

sd(indice$X1993)
## [1] 0.0957569

Esta es la desviación típica.

library(FinCal)
## 
## Attaching package: 'FinCal'
## The following objects are masked from 'package:psych':
## 
##     geometric.mean, harmonic.mean
coefficient.variation(sd=sd(indice$X1993), avg = mean(indice$X1993))
## [1] 0.1774645

Este coeficiente de variación se debe multiplicar 100%, en este caso 17,74645%

library(ggplot2)
base1=ggplot(indice,aes(x=X2000))
histNum= base1 + geom_histogram(bins=7) 
histNum 

base2=ggplot(indice,aes(y=X2000))
box=base2 + geom_boxplot() + coord_flip()

box

summary(indice$X2000)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4600  0.5175  0.5750  0.5763  0.6225  0.7500

La mediana es 0.575 y la media, 0.5763

library(psych)
skew(indice$X2000)
## [1] 0.318789

Este es el coeficiente de simetría, que nos indica que la asimetría es positiva.

kurtosi(indice$X2000)
## [1] -0.6641992

El coeficiente de curtosis al ser negativo llega a ser una curva platicúrtica.

var(indice$X2000)
## [1] 0.00559837

Esto indica la varianza.

sd(indice$X2000)
## [1] 0.07482225

Aquí se indica la desviación típica.

library(FinCal)
coefficient.variation(sd=sd(indice$X2000), avg = mean(indice$X2000))
## [1] 0.1298434

El coeficiente de variación es 12,98434%

library(ggplot2)
base1=ggplot(indice,aes(x=X2007))
histNum= base1 + geom_histogram(bins=7) 
histNum 

base2=ggplot(indice,aes(y=X2007))
box=base2 + geom_boxplot() + coord_flip()

box

summary(indice$X2007)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.5400  0.5700  0.6000  0.6029  0.6350  0.6800

Obtenemos la mediana (0.6) y la mediana (0.6029)

library(psych)
skew(indice$X2007)
## [1] 0.273128

La simetría es positiva en este caso

kurtosi(indice$X2007)
## [1] -1.115234

El valor negativo alejado del cero en este coeficiente de curtosis, nos puede indicar una curva platicúrtica.

var(indice$X2007)
## [1] 0.001430254
sd(indice$X2007)
## [1] 0.03781869
library(FinCal)
coefficient.variation(sd=sd(indice$X2007), avg = mean(indice$X2007))
## [1] 0.06272624

El coeficiente de variación es 6,272624%

library(ggplot2)
base1=ggplot(indice,aes(x=X2012))
histNum= base1 + geom_histogram(bins=7) 
histNum 

base2=ggplot(indice,aes(y=X2012))
box=base2 + geom_boxplot() + coord_flip()

box

summary(indice$X2012)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.3000  0.3875  0.4400  0.4529  0.5250  0.6300
library(psych)
skew(indice$X2012)
## [1] 0.3876477

Igualmente que en los casos anteriores, aquí se presenta una asimetría positiva.

kurtosi(indice$X2012)
## [1] -0.8969777

De la misma manera, la curtosis nos indica la curva platicúrtica.

var(indice$X2012)
## [1] 0.008247645
sd(indice$X2012)
## [1] 0.09081655
library(FinCal)
coefficient.variation(sd=sd(indice$X2012), avg = mean(indice$X2012))
## [1] 0.2005149

El coeficiente de variación es 20,05149%.