Entrega 2 - Análise de Gráficos para a base perfil_investidor_brasileiro_2019_2020.xlsx

library(readxl)
perfil <- read_excel("C:/Users/Laryssa/Desktop/Mestrado_UFF/Estatistica/Base_de_dados-master/perfil_investidor_brasileiro_2019_2020.xlsx", 
                     sheet = "Codigo")

perfil$sexo <- ifelse(perfil$sexo == 1, "Masculino","Feminino")
perfil$p1 <- ifelse(perfil$p1 == 1, "Sim", "Não")
perfil$idade <- ifelse(perfil$idade == 1, "16 a 24 anos", ifelse(perfil$idade == 2, "25 a 34 anos", ifelse(perfil$idade == 3, "35 a 44 anos", ifelse(perfil$idade == 4, "45 a 59 anos", "mais de 60 anos"))))

contagem <- table(perfil$p1)
nomes <- c("Sim","Não")
porcentagem <- round(contagem/sum(contagem)*100,2)
rotulo <- paste0(nomes, " (",porcentagem, "%",")")

pie(table(perfil$p1),main="Grafico 1 - Investiu?", col = c("seagreen","salmon3"), labels = rotulo)

No gráfico 1, tipo pizza podemos ver que de todos os entrevistados para a base de dados, apenas 28,93% fez algum tipo de investimento nos anos de 2019 e 2020. A maioria da população estudada não fez nenhum investimento financeiro. Para entendermos melhor essa população, vamos usar o segundo gráfico a seguir.

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
perfil %>% filter(p1 == "Sim") %>% select(UF) %>% table %>% barplot(main = "Gráfico 2 - Investidores por Estado", 
                                                                    xlab = "Estados", 
                                                                    ylab = "Nº de Investidores", 
                                                                    ylim=c(0,250),
                                                                    cex.names=.5, 
                                                                    xlim = c(0,30), 
                                                                    xpd=F, 
                                                                    col= c("darkblue","pink","yellow","green","orange","lightblue","red","grey","lightyellow","darkgreen","magenta","violet","brown","purple","darkred","aquamarine1","darkgoldenrod1","indianred3","mediumorchid1","lightslateblue","rosybrown1","tan1","turquoise2","orchid2","darkorange","coral1","cyan"),
                                                                    las=2 )
legend(x = "bottom",
       inset = c(0,-0.20), 
       legend = c("AC", "AL","AM","AP","BA","CE","DF","ES","GO","MA","MG","MS","MT","PA","PB","PE","PI","PR","RJ","RN","RO","RS","SC","SE","SP","TO"), 
       fill = c("darkblue","pink","yellow","green","orange","lightblue","red","grey","lightyellow","darkgreen","magenta","violet","brown","purple","darkred","aquamarine1","darkgoldenrod1","indianred3","mediumorchid1","lightslateblue","rosybrown1","tan1","turquoise2","orchid2","darkorange","coral1","cyan"),,
       col = c("darkblue","pink","yellow","green","orange","lightblue","red","grey","lightyellow","darkgreen","magenta","violet","brown","purple","darkred","aquamarine1","darkgoldenrod1","indianred3","mediumorchid1","lightslateblue","rosybrown1","tan1","turquoise2","orchid2","darkorange","coral1","cyan"),
       xpd = TRUE,
       horiz = TRUE,
       cex = .25,
       title = "Legenda")

No Gráfico 2 podemos ver os investidores distribuidos por estado brasileiro, vendo que estados da região sudeste tem pessoas que investiram mais seu dinheiro, com os 3 primeiros sendo São Paulo, Minas Gerais e Rio de Janeiro. Enquanto estados do norte ou nordeste como Acre, Amapá, Rio Grande do Norte e Tocantins são os com menos investidores. Isso pode acontecer por que as regiões sul e sudeste são mais desenvolvidas e com uma renda média superior a outras regiões brasileiras, assim essas pessoas tem sobra de dinheiro ao final do mês após pagamento das contas para fazer investimentos financeiros.

contagem2 <- table(perfil$idade)
nomes2 <- c("16 a 24 anos","25 a 34 anos","35 a 44 anos","45 a 59 anos", "mais de 60 anos")
porcentagem2 <- round(contagem2/sum(contagem2)*100,2)
rotulo2 <- paste0(nomes2, " (",porcentagem2, "%",")")

perfil %>% filter(p1 == "Sim") %>% select(idade) %>% table %>% pie(main="Grafico 3 - Investidores por idade", labels =rotulo2)

E por fim no último gráfico podemos ver que entre 25 e 59 anos os investimentos são bem equilibrados entre as idades, enquanto menores de 25, geralmente ainda em época de faculdade e sem um sálário, e maiores de 60 anos, idade de aposentadoria, tem uma diminuição dos investimentos por não serem tão economicamente ativos quanto as outras idades.