Carregando as bibliotecas ggplot2, ggthemes, flextable e dplyr.
library(ggplot2)
library(ggthemes)
library(flextable)
library(dplyr)
Aqui importamos a base de dados Chile e limpamos os dados necessários.
load("C:\\Users\\pedro\\OneDrive\\Documentos\\Base_de_dados-master\\chile\\Chile.RData")
chile2 = na.omit(Chile)
chile2$Escolaridade = gsub("PS", "3", chile2$education)
chile2$Escolaridade = gsub("P", "1", chile2$Escolaridade)
chile2$Escolaridade = gsub("S", "2", chile2$Escolaridade)
chile2$Escolaridade = gsub("3", "Superior", chile2$Escolaridade)
chile2$Escolaridade = gsub("2", "Médio", chile2$Escolaridade)
chile2$Escolaridade = gsub("1", "Fundamental", chile2$Escolaridade)
chile2 %>% group_by(Escolaridade) %>%
summarise(Média = round(mean(income)),
Desvio_padrão = round(sd(income)),
Mínimo = round(min(income)),
Mediana = round(median(income)),
Máximo = round(max(income))) %>%
flextable() %>%
theme_vanilla()
Escolaridade | Média | Desvio_padrão | Mínimo | Mediana | Máximo |
|---|---|---|---|---|---|
Fundamental | 17,535 | 17,847 | 2,500 | 15,000 | 200,000 |
Médio | 35,851 | 35,972 | 2,500 | 35,000 | 200,000 |
Superior | 69,027 | 58,366 | 2,500 | 35,000 | 200,000 |
Nessa tabela podemos ver o impacto da escolaridade de uma pessoa chilena no final do século XX na sua renda mensal. Podemos ver que quanto maior o seu nível de escolaridade maior a sua renda média, entretanto, vemos também que pessoas com nível de escolaridade médio e superior apresentam a mesma mediana, 35,000 pesos, indicando que apesar da diferença média, é comum termos pessoas com níveis de escolaridade diferentes com salários similares.
Além disso, vemos que todos os níveis de escolaridade apresentam o mesmo mínimo e o mesmo máximo, indicando que existem pessoas que mesmo com nível fundamental ou médio de escolaridade que conseguem chegar a um salário de 200,000 pesos, enquanto existem, também, pessoas com escolaridade de nível superior com um salário de 2,500 pesos.
chile2 %>%
select(Escolaridade, income) %>%
ggplot(aes(x=Escolaridade, y = income)) +
geom_boxplot(fill = c("#02c2bb","#004e75","#020a96")) +
labs(x = "Escolaridade", y = "Salário (em pesos chilenos)",
title = " Gráfico: salário (em pesos) x escolaridade",
caption = "Fonte: base de dados Chile Processamento: Pedro Gonçalves da Cunha") +
theme_fivethirtyeight()
Nesse gráfico podemos ver de uma forma mais visual que as pessoas chilenas no final do século XX com ensino de nível fundamental ganham, em geral, menos dinheiro mensalmente que as pessoas com ensino de nível médio e de nível superior.
Fica mais claro também que as pessoas com salário de 200 mil pesos são outliers e ficam totalmente fora do padrão médio da população chilena. Em sumo, o gráfico ilustra de forma mais clara e visual aquilo que a tabela nos mostrou.