PROVA

Author

GUILHERME DE ANDRADE LUNA

QUESTÃO 1

Essa prova será respondida usando o Quarto no Rstudio.

QUESTÃO 2

Tidyverse é uma Coleção de pacotes do R para ciência de dados que compartilham filosofia comum de organização de dados em formato ‘tidy’. Ele facilita a análise de grandes bases de dados transformando essa análise em algo mais compacto e fluido, devido sua capacidade de integração de pacotes.

Função: pipe ou %>%, essa função é conhecida com ‘e então’. Ela permite encadear comandos de forma sequencial.

Função: select(), ela é utilizada para selecionar colunas de um data frame.

Função: filter(), ela é utilizada para filtrar linhas de um data frame.

Função: mutate(), ela é utilizada para criação ou modificar colunas.

A diferença entre um data.frame e uma tibble, consiste no fato do data frame ser um modelo mais antigo que traz uma tabela que relaciona dados em linhas e colunas de uma forma mais limitada. Já o tibble é um data frame melhorado com mais funções ligadas ao tidyverse. Então usamos tibble quando precisa-se trabalhar com tidyverse pois ele traz mais segurança e uma visualização mais moderna . E o data.frame quando precisa- se trabalhar com funções antigas da base R pois ele garante melhor compatilidade.

QUESTÃO 3

O tidyverse pode ser considerado um conjunto de pacotes de código aberto e software livre devido o R ser uma linguagem de programação de código aberto porque o seu código fonte é público, permitindo inspeção, modificação e distribuição. E também de softwarelivre porque respeita as 4 liberdades da free software fundation, que são elas: a de executar para qualquer propósito, a de utilizar para estudar e adaptar, a de redistribuir cópias e a de contribuir para a melhoria da própria linguagem de programação.

QUESTÃO 4

Para montar montar a tabela comparativa do IPCA do Brasil, Rio de Janeiro e Salvador, primeiro carregamos os pacotes através da função library() que ativará os pacotes do R. Para Importamos os dados do Sidra para o R, primeiro montamos o layout da tabela que queremos visualizar, depois escolhemos as variáveis que serão analisadas, baixamos a tabela em CSV (BR), depois limpamos os dados dela para facilitar o manuseio dos dados, em seguida trazemos a ela pro R através da função read.csv2(). Com a tabela no R, Selecionamos as colunas que queremos extrair os dados, com a função select (). Para Converter a coluna de datas usamos a função as.date(paste0() e a função mutate() para gerar uma nova coluna. Por fim, utilizamos a função view () para visualizar a tabela.

library(sidrar) 
library(dplyr) 
library(tidyr) 
library(ggplot2)
library(lubridate)



# Baixar a Tabela 7060 do SIDRA - IPCA para Rio de Janeiro e Salvador 

dados_ipca <- read.csv2("tabela__7060.csv")

# Preparar os dados usando ferramentas do tidyverse 

tabela_7060 <- dados_ipca %>%   select(Mês,Região Metropolitana, Valor)  

# Converter a coluna de datas

tabela_7060$Mês <- as.Date(paste0("01/", tabela_7060$Mês), format = "%d/%m/%Y") tabela_7060 <- tabela_7060 %>% mutate(Mês)  

# Mostrar tabela 
View(tabela_7060)

QUESTÃO 5

Para montar montar a tabela comparativa do PIB e do PIB per capita, primeiro carregamos os pacotes através da função library() que ativará os pacotes do R. Para Importamos os dados do Sidra para o R, primeiro montamos o layout da tabela que queremos visualizar, depois escolhemos as variáveis que serão analisadas, baixamos a tabela em CSV (BR), depois limpamos os dados dela para facilitar o manuseio dos dados, em seguida trazemos a ela pro R através da função read.csv2(). Com a tabela no R, Selecionamos as colunas que queremos extrair os dados, com a função select (). Por fim, utilizamos a função view () para visualizar a tabela. Já no gráfico, utilizamos a função ggplot2(), definimos as variáveis do grafico sendo x (Ano) e o y (PIB per capita), usamos a função geom_line criar as linhas, definimos a cor através de color =. E por final definimos um título através da opção title = ‘Evolução do PIB per capita no Brasil’ e um subtítulo através da opção subtitle = ‘Valores a preços correntes’. As informações da tabela são evidenciadar por caption = ‘Fonte: SIDRA/IBGE - Tabela 6784’ ). E para deixar o gráfico mais compacto e fácil de visualizar utilizamos a função + theme_minimal().

library(sidrar) 
library(dplyr) 
library(ggplot2) 
library(tidyr)  
# Baixar dados da Tabela 6784 do SIDRA - PIB e PIB per capita 

dados_pib <- read.csv2("tabela__6748.csv")  

# Preparar os dados 

tabela_6784<- dados_pib %>% select(Ano, PIB, PIB_per_capita) 


# Mostrar tabela 
View(tabela_pib)

ggplot2(tabela_6784, aes(x = Ano, y = PIB_per_capita)) +   geom_line(group = 1, color = "red", size = 2) +   geom_point(color = "blue", size = 3) +   labs(     x = 'Ano',     y = 'PIB per capita (R$)',     title = 'Evolução do PIB per capita no Brasil',     subtitle = 'Valores a preços correntes',     caption = 'Fonte: SIDRA/IBGE - Tabela 6784'   ) +   theme_minimal()