PROVA
QUESTÃO 1
Essa prova será respondida usando o Quarto no Rstudio.
QUESTÃO 2
Tidyverse é uma Coleção de pacotes do R para ciência de dados que compartilham filosofia comum de organização de dados em formato ‘tidy’. Ele facilita a análise de grandes bases de dados transformando essa análise em algo mais compacto e fluido, devido sua capacidade de integração de pacotes.
Função: pipe ou %>%, essa função é conhecida com ‘e então’. Ela permite encadear comandos de forma sequencial.
Função: select(), ela é utilizada para selecionar colunas de um data frame.
Função: filter(), ela é utilizada para filtrar linhas de um data frame.
Função: mutate(), ela é utilizada para criação ou modificar colunas.
A diferença entre um data.frame e uma tibble, consiste no fato do data frame ser um modelo mais antigo que traz uma tabela que relaciona dados em linhas e colunas de uma forma mais limitada. Já o tibble é um data frame melhorado com mais funções ligadas ao tidyverse. Então usamos tibble quando precisa-se trabalhar com tidyverse pois ele traz mais segurança e uma visualização mais moderna . E o data.frame quando precisa- se trabalhar com funções antigas da base R pois ele garante melhor compatilidade.
QUESTÃO 3
O tidyverse pode ser considerado um conjunto de pacotes de código aberto e software livre devido o R ser uma linguagem de programação de código aberto porque o seu código fonte é público, permitindo inspeção, modificação e distribuição. E também de softwarelivre porque respeita as 4 liberdades da free software fundation, que são elas: a de executar para qualquer propósito, a de utilizar para estudar e adaptar, a de redistribuir cópias e a de contribuir para a melhoria da própria linguagem de programação.
QUESTÃO 4
Para montar montar a tabela comparativa do IPCA do Brasil, Rio de Janeiro e Salvador, primeiro carregamos os pacotes através da função library() que ativará os pacotes do R. Para Importamos os dados do Sidra para o R, primeiro montamos o layout da tabela que queremos visualizar, depois escolhemos as variáveis que serão analisadas, baixamos a tabela em CSV (BR), depois limpamos os dados dela para facilitar o manuseio dos dados, em seguida trazemos a ela pro R através da função read.csv2(). Com a tabela no R, Selecionamos as colunas que queremos extrair os dados, com a função select (). Para Converter a coluna de datas usamos a função as.date(paste0() e a função mutate() para gerar uma nova coluna. Por fim, utilizamos a função view () para visualizar a tabela.
library(sidrar)
library(dplyr)
library(tidyr)
library(ggplot2)
library(lubridate)
# Baixar a Tabela 7060 do SIDRA - IPCA para Rio de Janeiro e Salvador
dados_ipca <- read.csv2("tabela__7060.csv")
# Preparar os dados usando ferramentas do tidyverse
tabela_7060 <- dados_ipca %>% select(Mês,Região Metropolitana, Valor)
# Converter a coluna de datas
tabela_7060$Mês <- as.Date(paste0("01/", tabela_7060$Mês), format = "%d/%m/%Y") tabela_7060 <- tabela_7060 %>% mutate(Mês)
# Mostrar tabela
View(tabela_7060)
QUESTÃO 5
Para montar montar a tabela comparativa do PIB e do PIB per capita, primeiro carregamos os pacotes através da função library() que ativará os pacotes do R. Para Importamos os dados do Sidra para o R, primeiro montamos o layout da tabela que queremos visualizar, depois escolhemos as variáveis que serão analisadas, baixamos a tabela em CSV (BR), depois limpamos os dados dela para facilitar o manuseio dos dados, em seguida trazemos a ela pro R através da função read.csv2(). Com a tabela no R, Selecionamos as colunas que queremos extrair os dados, com a função select (). Por fim, utilizamos a função view () para visualizar a tabela. Já no gráfico, utilizamos a função ggplot2(), definimos as variáveis do grafico sendo x (Ano) e o y (PIB per capita), usamos a função geom_line criar as linhas, definimos a cor através de color =. E por final definimos um título através da opção title = ‘Evolução do PIB per capita no Brasil’ e um subtítulo através da opção subtitle = ‘Valores a preços correntes’. As informações da tabela são evidenciadar por caption = ‘Fonte: SIDRA/IBGE - Tabela 6784’ ). E para deixar o gráfico mais compacto e fácil de visualizar utilizamos a função + theme_minimal().
library(sidrar)
library(dplyr)
library(ggplot2)
library(tidyr)
# Baixar dados da Tabela 6784 do SIDRA - PIB e PIB per capita
dados_pib <- read.csv2("tabela__6748.csv")
# Preparar os dados
tabela_6784<- dados_pib %>% select(Ano, PIB, PIB_per_capita)
# Mostrar tabela
View(tabela_pib)
ggplot2(tabela_6784, aes(x = Ano, y = PIB_per_capita)) + geom_line(group = 1, color = "red", size = 2) + geom_point(color = "blue", size = 3) + labs( x = 'Ano', y = 'PIB per capita (R$)', title = 'Evolução do PIB per capita no Brasil', subtitle = 'Valores a preços correntes', caption = 'Fonte: SIDRA/IBGE - Tabela 6784' ) + theme_minimal()