Ejercicios
Carga todas las librerías del notebook clase_4.
Tip si quieres eliminar los NA de la muestra sigue este ejemplo. Así sacarán todos los missing values de su dataframe al ejecutar una función. Ojo! aplicar cuando sea necesario.
x<-c(NA,NA,3,4,5,6)
x %>% na.omit()
## [1] 3 4 5 6
## attr(,"na.action")
## [1] 1 2
## attr(,"class")
## [1] "omit"
- Usando la función
WDIsearch obten los códigos para pib per capita a precios constantes/reales, gini, población, consumo final e inflación
- Crea un data frame llamado wdi_1 y conviertelo en un tibble.
- Selecciona del tibble solo las variables del punto 1 y la columna de país
- Obten estadísticas descriptivas usando stat.desc()
- Ordena por países en orden ascendente usando arrange()
- Crea una nueva variable que sea el crecimiento del pib per capita en el tiempo por país. Usa las funciones group_by() y mutate para generar la nueva variable. Recuerda solo es un cambio porcentual. Hint: busca en R funciones o ayudas en blogs como Stack Overflow o Rpubs.
- Usa la función filter() para obtener datos para todos los países de América del Sur, excluyendo Guyana y Suriname. Asigna este dataframe/tibble es el nuevo dataframe/tibble que usaremos.
- Mediante la función summarise encuentra el número de observaciones, media, desviación estándar, mediana, y quintiles.
- Crea un ggplot de caja y bigote. Usa + facet(~country) en tu ggplot para tener un gráfico por país.
- Investiga el geom_line de ggplot2. Crea un gráfico en donde y sea el crecimiento del pib y x sea los años. Usa facet para crear un gráfico por país.
- El siguiente código genera un histograma donde se muestran los quintiles marcados en la distribución.
dt <- data.frame(x=c(1:200),y=rnorm(200))
dens <- density(dt$y)
df <- data.frame(x=dens$x, y=dens$y)
probs <- c(0, 0.25, 0.5, 0.75, 1)
quantiles <- quantile(dt$y, prob=probs)
df$quant <- factor(findInterval(df$x,quantiles))
ggplot(df, aes(x,y)) + geom_line() + geom_ribbon(aes(ymin=0, ymax=y, fill=quant)) + scale_x_continuous(breaks=quantiles) + scale_fill_brewer(guide="none")

Usando el código crea un histograma con quintiles marcados para la variable de consumo.