PRACTICA CALIFICADA (NUMERICAS)

PRIMERA PARTE:

Extraiga la data de wikipedia de Indice de Democracia, quedese con la columna pais y score. Pre procese la tabla adecuadamente. link: https://es.wikipedia.org/wiki/%C3%8Dndice_de_democracia
library(htmltab)
LINK2="https://es.wikipedia.org/wiki/%C3%8Dndice_de_democracia"
LINKDEMO= "///div/table[2]"

INDICE= htmltab(doc = LINK2,
                which = LINKDEMO)
names(INDICE)
## [1] "Puesto"                        "País"                         
## [3] "Puntuación"                    "Proceso electoraly pluralismo"
## [5] "Funcionamientodel gobierno"    "Participaciónpolítica"        
## [7] "Culturapolítica"               "Derechosciviles"              
## [9] "Categoría"
INDICE=INDICE[,c(2, 3)]
names(INDICE)
## [1] "País"       "Puntuación"
INDICE$Puntuación
##   [1] "9.87" "9.58" "9.39" "9.26" "9.22" "9.15" "9.15" "9.14" "9.09" "9.03"
##  [11] "8.89" "8.81" "8.68" "8.53" "8.38" "8.29" "8.22" "8.21" "8.08" "8.07"
##  [21] "8.00" "7.99" "7.97" "7.97" "7.96" "7.88" "7.84" "7.81" "7.80" "7.79"
##  [31] "7.78" "7.73" "7.71" "7.69" "7.59" "7.50" "7.50" "7.38" "7.29" "7.24"
##  [41] "7.23" "7.19" "7.16" "7.10" "7.05" "7.03" "7.02" "7.02" "6.98" "6.97"
##  [51] "6.96" "6.88" "6.71" "6.67" "6.67" "6.64" "6.63" "6.63" "6.60" "6.57"
##  [61] "6.54" "6.50" "6.41" "6.41" "6.39" "6.38" "6.38" "6.27" "6.25" "6.24"
##  [71] "6.19" "6.19" "6.15" "6.15" "6.03" "5.98" "5.96" "5.87" "5.85" "5.85"
##  [81] "5.74" "5.74" "5.70" "5.69" "5.63" "5.61" "5.60" "5.57" "5.50" "5.49"
##  [91] "5.41" "5.41" "5.35" "5.30" "5.22" "5.20" "5.18" "5.11" "5.11" "4.99"
## [101] "4.98" "4.91" "4.79" "4.75" "4.66" "4.63" "4.63" "4.44" "4.39" "4.37"
## [111] "4.31" "4.17" "4.15" "4.06" "3.93" "3.85" "3.85" "3.83" "3.82" "3.76"
## [121] "3.71" "3.63" "3.62" "3.61" "3.59" "3.50" "3.36" "3.35" "3.35" "3.32"
## [131] "3.31" "3.28" "3.19" "3.16" "3.16" "3.14" "3.13" "3.10" "3.08" "3.04"
## [141] "3.03" "3.00" "2.97" "2.94" "2.94" "2.87" "2.76" "2.71" "2.65" "2.45"
## [151] "2.37" "2.37" "2.33" "2.19" "2.15" "2.01" "1.98" "1.95" "1.93" "1.93"
## [161] "1.92" "1.72" "1.61" "1.52" "1.49" "1.43" "1.08"
str(INDICE$Puntuación)
##  chr [1:167] "9.87" "9.58" "9.39" "9.26" "9.22" "9.15" "9.15" "9.14" ...
INDICE$Puntuación=as.numeric(INDICE$Puntuación)
str(INDICE$Puntuación)
##  num [1:167] 9.87 9.58 9.39 9.26 9.22 9.15 9.15 9.14 9.09 9.03 ...

SEGUNDA PARTE

A. Realice un histograma e interprete

summary(INDICE$Puntuación)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.080   3.545   5.690   5.479   7.175   9.870
library(ggplot2)
base1=ggplot(INDICE,aes(x=Puntuación))
histNum= base1 + geom_histogram(bins=7) 
histNum 

en este grafico podemos observar que no es del todo asimetrico pues paices con una puntuacion superior a 9, son muy escasos (menores a 10, como se nota en el grafico), lo mismo sucede con los que tienen una puntuacion muy baja (los cuales tienen tambien poco mas de 10); mas entonces los demas grupos, estan en cierto páralelo, pero los que tiene }n mayor numero son los gupos de en medio, (3,4,5 y 6) que juntos son la mayoria, esto nos dice que en el mundo, hay muy pocos paises con idh muy bgajo y muy alto, y la mayoria estan en la media.

B. Halle la distancia intercuartilica y calcule con ella el umbral de atipicos.

IQR(INDICE$Puntuación)
## [1] 3.63

LA DISTANCIA ENTRE CADA CUARTIL ES DE APROXIMADAMENTE TRES Y MEDIO.

# cuartil tres
q3=as.numeric(summary(INDICE$Puntuación)[5])

# calculando umbral (distancia del q3)
umbral= q3+1.5*IQR(INDICE$Puntuación)
umbral
## [1] 12.62

TODO AQUEL NUMERO ENCIMA DE 12.62 ES ATIPICO C. ¿Se puede afirmar que la asimetría es positiva o negativa?

library(DescTools)
Skew(INDICE$Puntuación,conf.level = 0.05)
##        skew      lwr.ci      upr.ci 
## -0.07107195 -0.07650009 -0.06510621

la asimetria es negativa

D.¿Cuenta con valores atipicos? Ofrezca un gráfico para observarlos y luego indique cuales son.

NO CUENTA CON VALORES ATIPICOS

base2=ggplot(INDICE,aes(y=Puntuación))
box=base2 + geom_boxplot() + coord_flip()

box 

library(ggplot2)

estadigrafos=round(as.vector(summary(INDICE$Puntuación)),2)

box + scale_y_continuous(breaks = estadigrafos)

INDICE[INDICE$Puntuación>umbral,]
## [1] País       Puntuación
## <0 rows> (or 0-length row.names)

NO HAY NINGUN ATIPICO…

E. Halle el GINI, interprete y acompañelo con la curva de Lorentz

Gini(INDICE$Puntuación,conf.level=0.95)
##      gini    lwr.ci    upr.ci 
## 0.2316285 0.2090811 0.2586798

recordemos: “Si el Gini es 0, todas las todos los paises tienen el mismo indicador ; si fuera 1, un solo pais a tendria toda la puntuacion” el indice esta en 0.2 aproximadamente, esto representa que hay una cierta medida de igualdad en la puntuación

library(gglorenz)
## Registered S3 methods overwritten by 'ineq':
##   method   from     
##   plot.Lc  DescTools
##   lines.Lc DescTools
base1 + gglorenz::stat_lorenz(color='yellow') +
    geom_abline(linetype = "dashed") + coord_fixed() +
    labs(x = "% de paises ordenados por su indice de democracia",
         y = "puntuacion de indice de democracia",
         title = "pais / indice de democracia",
         caption = "Fuente: The economist")