#Práctica calificada 3 Importando los datos de la web:
library(htmltab)
linkPage="https://es.wikipedia.org/wiki/%C3%8Dndice_de_democracia"
linkTabla="///div/table[2]"
IDemo=htmltab(doc = linkPage, which = linkTabla)
Observando las variables…
str(IDemo)
## 'data.frame': 167 obs. of 9 variables:
## $ Puesto : chr "1" "2" "3" "4" ...
## $ País : chr "Noruega" " Islandia" "Suecia" " Nueva Zelanda" ...
## $ Puntuación : chr "9.87" "9.58" "9.39" "9.26" ...
## $ Proceso electoraly pluralismo: chr "10.00" "10.00" "9.58" "10.00" ...
## $ Funcionamientodel gobierno : chr "9.64" "9.29" "9.64" "9.29" ...
## $ Participaciónpolítica : chr "10.00" "8.89" "8.33" "8.89" ...
## $ Culturapolítica : chr "10.00" "10.00" "10.00" "8.13" ...
## $ Derechosciviles : chr "9.71" "9.71" "9.41" "10.00" ...
## $ Categoría : chr "Democracia plena" "Democracia plena" "Democracia plena" "Democracia plena" ...
Convertiré únicamente la columna “Puntuación”, esta es la que usaré para el análisis.
IDemo$Puntuación=as.numeric(IDemo$Puntuación)
comprobando…
str(IDemo)
## 'data.frame': 167 obs. of 9 variables:
## $ Puesto : chr "1" "2" "3" "4" ...
## $ País : chr "Noruega" " Islandia" "Suecia" " Nueva Zelanda" ...
## $ Puntuación : num 9.87 9.58 9.39 9.26 9.22 9.15 9.15 9.14 9.09 9.03 ...
## $ Proceso electoraly pluralismo: chr "10.00" "10.00" "9.58" "10.00" ...
## $ Funcionamientodel gobierno : chr "9.64" "9.29" "9.64" "9.29" ...
## $ Participaciónpolítica : chr "10.00" "8.89" "8.33" "8.89" ...
## $ Culturapolítica : chr "10.00" "10.00" "10.00" "8.13" ...
## $ Derechosciviles : chr "9.71" "9.71" "9.41" "10.00" ...
## $ Categoría : chr "Democracia plena" "Democracia plena" "Democracia plena" "Democracia plena" ...
##Parte 2. Exploración Gráfica ### a. HISTOGRAMA
library(ggplot2)
base1=ggplot(IDemo, aes(x=Puntuación))
histNum= base1 + geom_histogram(bins=7)
histNum
Del gráfico podemos decir que, como no es simétrico, informar la media de puntuación no será muy representativa (la mediana será la mejor opción); por otro lado, como la asimetría nos muestra que un reducido número de países tienen una alta puntuación, pero no estamos seguros de si están tan lejos del ‘centro’ para ser atípicos.
IQR(IDemo$Puntuación)
## [1] 3.63
Es decir, entre el primer y tercer cuartil hay 3.63 valores; asi, el 50% de los valores centrales varian en 3.63 valores.
#cuartil tres
q3=as.numeric(summary(IDemo$Puntuación)[5])
#calculando umbral (distancia del q3)
umbral= q3 + 1.5*IQR(IDemo$Puntuación)
umbral
## [1] 12.62
Esto quiere decir que todo valor superior a 12.62 será considerado un atípico.
IDemo[IDemo$Puntuación> umbral,]
## [1] Puesto País
## [3] Puntuación Proceso electoraly pluralismo
## [5] Funcionamientodel gobierno Participaciónpolítica
## [7] Culturapolítica Derechosciviles
## [9] Categoría
## <0 rows> (or 0-length row.names)
No hay atípicos.
base2=ggplot(IDemo, aes(y=Puntuación))
box= base2 + geom_boxplot() + coord_flip()
box
No hay atípicos. Calculando el coeficiente respectivo a la asimetría…
library(DescTools)
Skew(IDemo$Puntuación,conf.level = 0.05)
## skew lwr.ci upr.ci
## -0.07107195 -0.07998922 -0.06685679
library(ggplot2)
estadigrafos=round(as.vector(summary(IDemo$Puntuación)),2)
box + scale_y_continuous(breaks = estadigrafos)
¿La asimetría es positiva o negativa? la cola está hacia a la izquierda, asimetría negativa además la mediana es mayor que la media. Comprobando…
summary(IDemo$Puntuación)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.080 3.545 5.690 5.479 7.175 9.870
###e. Representando en el GINI y curva de Lorenz #### e.1. GINI
Gini(IDemo$Puntuación, conf.level = 0.95)
## gini lwr.ci upr.ci
## 0.2316285 0.2109207 0.2586334
El Gini no es 0 debido a que no todos los países tienen la misma puntuación
library(gglorenz)
## Registered S3 methods overwritten by 'ineq':
## method from
## plot.Lc DescTools
## lines.Lc DescTools
base1 + gglorenz::stat_lorenz(color="red") +
geom_abline(linetype= "dashed") + coord_fixed() +
labs(x= "%países ordenados por puntuación en democracia",
y= "%Puntuación en democracia",
title = "Puntuación en democracia por países",
caption = "fuente: Wikipedia")
No hay igualdad de puntuación porque de ser así la curva correspondería a la diagonal, dejando de ser una curva; algo que podemos afirmar es que la puntuación no difiere en demasía entre países.