library(htmltab)

democracy = htmltab(doc="https://es.wikipedia.org/wiki/%C3%8Dndice_de_democracia", which = "/html/body/div[3]/div[3]/div[4]/div/table[2]")

PARTE 1:Preprocesamiento

str (democracy)
## 'data.frame':    167 obs. of  9 variables:
##  $ Puesto                       : chr  "1" "2" "3" "4" ...
##  $ País                         : chr  "Noruega" " Islandia" "Suecia" " Nueva Zelanda" ...
##  $ Puntuación                   : chr  "9.87" "9.58" "9.39" "9.26" ...
##  $ Proceso electoraly pluralismo: chr  "10.00" "10.00" "9.58" "10.00" ...
##  $ Funcionamientodel gobierno   : chr  "9.64" "9.29" "9.64" "9.29" ...
##  $ Participaciónpolítica        : chr  "10.00" "8.89" "8.33" "8.89" ...
##  $ Culturapolítica              : chr  "10.00" "10.00" "10.00" "8.13" ...
##  $ Derechosciviles              : chr  "9.71" "9.71" "9.41" "10.00" ...
##  $ Categoría                    : chr  "Democracia plena" "Democracia plena" "Democracia plena" "Democracia plena" ...
democracy = democracy [,c(2,3)]
democracy$Puntuación = as.numeric(democracy$Puntuación)
str (democracy)
## 'data.frame':    167 obs. of  2 variables:
##  $ País      : chr  "Noruega" " Islandia" "Suecia" " Nueva Zelanda" ...
##  $ Puntuación: num  9.87 9.58 9.39 9.26 9.22 9.15 9.15 9.14 9.09 9.03 ...

PARTE 2

A) Se puede inferir que hay una leve inclinación a la izquierda, no hay simetría.

library(ggplot2)
aas= ggplot(democracy,aes(x=Puntuación)) + geom_histogram(bins=8) 
aas  

B)La distancia intercuartílica es 3.63 y el umbral de atípicos es de 12.62

IQR(democracy$Puntuación)
## [1] 3.63
sooo=as.numeric(summary(democracy$Puntuación)[5])


umbral= sooo+1.5*IQR(democracy$Puntuación)
umbral
## [1] 12.62

C) No existe ningún valor atípico. Para confirmarlo tenemos el boxplot, en el cual no se oberva ningún punto que se aleje del cuadro en sí.

democracy[democracy$Puntuación>umbral,]
## [1] País       Puntuación
## <0 rows> (or 0-length row.names)
asosaiosa=ggplot(democracy,aes(y=Puntuación)) + geom_boxplot() + coord_flip()
asosaiosa

D) La asimetría es negativa debido a que la mediana es mayor que la media y a que hay una tendencia negativa, hecho que se puede constatar tanto en el boxplot, en el cuadro summary y en el skew.

summary(democracy$Puntuación)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.080   3.545   5.690   5.479   7.175   9.870
daxewcwdcwc=round(as.vector(summary(democracy$Puntuación)), 2)

asosaiosa + scale_y_continuous(breaks = daxewcwdcwc)

library(DescTools)
Skew(democracy$Puntuación,conf.level =  0.05)
##        skew      lwr.ci      upr.ci 
## -0.07107195 -0.07252846 -0.05770996

Cuando es negativo, la cola se da a la izquierda.

E) El Gini es 0 y la curva se acerca a la diagonal, por ende, la mayoría de los países habidos en el cuadro poseen cierto grado de democracia.

Gini(democracy$Puntuación,conf.level=0.95)
##      gini    lwr.ci    upr.ci 
## 0.2316285 0.2101643 0.2575789
library(gglorenz)
## Registered S3 methods overwritten by 'ineq':
##   method   from     
##   plot.Lc  DescTools
##   lines.Lc DescTools
ggplot(democracy,aes(x=Puntuación))+ gglorenz::stat_lorenz(color='red') +
    geom_abline(linetype = "dashed") + coord_fixed() +
    labs(x = "Países en total",
         y = "Índice",
         title = "Índice de democracia",
         caption = "Fuente: Wikipedia")