PROVA LDE

  1. O QUE É O TIDYVERSE? EXPLIQUE AS SEGUINTES FUNÇÕES: PIPE, SELECT, FILTER, MUTATE. QUAL A DIFERENÇA ENTRE UM DATA.FRAME E UM TIBBLE?

RESPOSTA: Tidyverse é o conjunto de pacotes integrados para manipulação e visualização. pipe-> Operador usado para encadear funções, passando o resultado de uma como entrada para a seguinte, tornando o código mais legível. select-> Usado para escolher as colunas. filter-> Filtrar os dados das tabelas mutate-> Cria ou transforma colunas.

Data.frame é uma estrutura de dados tradicional do R, que pode modificar automaticamente nomes de colunas e exibir valores de forma simplificada.O tibble é uma versão mais moderna usada no tidyverse, que mantém os nomes das colunas, não converte caracteres em fatores automaticamente e apresenta a saída de forma mais clara e resumida no console.

  1. EM QUE SENTIDO O TIDYVERSE PODE SER CONSIDERADO UM CONJUNTO DE PACOTES DE CÓDIGO ABERTO E TAMBÉM UM SOFTWARE LIVRE?

RESPOSTA: O tidyverse pode ser considerado pois o seu codigo fonte está disponivel publicamente para que pessoas possam modificar, estudar e contribuir para o desenvolvimento dos pacotes. Além disso, é também um software livre, pois é distribuído sob licenças como a GPL, que garantem as quatro liberdades fundamentais: usar, estudar, modificar e redistribuir o software.

options(repos = c(CRAN = "https://cloud.r-project.org"))

#instalar pacotes
install.packages("tidyverse")
Instalando pacote em 'C:/Users/jaeds/AppData/Local/R/win-library/4.5'
(como 'lib' não foi especificado)
pacote 'tidyverse' desempacotado com sucesso e somas MD5 verificadas

Os pacotes binários baixados estão em
    C:\Users\jaeds\AppData\Local\Temp\RtmpykLxJp\downloaded_packages
install.packages("readxl")
Instalando pacote em 'C:/Users/jaeds/AppData/Local/R/win-library/4.5'
(como 'lib' não foi especificado)
pacote 'readxl' desempacotado com sucesso e somas MD5 verificadas

Os pacotes binários baixados estão em
    C:\Users\jaeds\AppData\Local\Temp\RtmpykLxJp\downloaded_packages
install.packages("janitor")
Instalando pacote em 'C:/Users/jaeds/AppData/Local/R/win-library/4.5'
(como 'lib' não foi especificado)
pacote 'janitor' desempacotado com sucesso e somas MD5 verificadas

Os pacotes binários baixados estão em
    C:\Users\jaeds\AppData\Local\Temp\RtmpykLxJp\downloaded_packages
install.packages("lubridate")
Instalando pacote em 'C:/Users/jaeds/AppData/Local/R/win-library/4.5'
(como 'lib' não foi especificado)
pacote 'lubridate' desempacotado com sucesso e somas MD5 verificadas

Os pacotes binários baixados estão em
    C:\Users\jaeds\AppData\Local\Temp\RtmpykLxJp\downloaded_packages
install.packages("dplyr")
Instalando pacote em 'C:/Users/jaeds/AppData/Local/R/win-library/4.5'
(como 'lib' não foi especificado)
pacote 'dplyr' desempacotado com sucesso e somas MD5 verificadas

Os pacotes binários baixados estão em
    C:\Users\jaeds\AppData\Local\Temp\RtmpykLxJp\downloaded_packages
install.packages("stringr")
Instalando pacote em 'C:/Users/jaeds/AppData/Local/R/win-library/4.5'
(como 'lib' não foi especificado)
pacote 'stringr' desempacotado com sucesso e somas MD5 verificadas

Os pacotes binários baixados estão em
    C:\Users\jaeds\AppData\Local\Temp\RtmpykLxJp\downloaded_packages
install.packages("scales")
Instalando pacote em 'C:/Users/jaeds/AppData/Local/R/win-library/4.5'
(como 'lib' não foi especificado)
pacote 'scales' desempacotado com sucesso e somas MD5 verificadas

Os pacotes binários baixados estão em
    C:\Users\jaeds\AppData\Local\Temp\RtmpykLxJp\downloaded_packages
install.packages("ggplot2")
Instalando pacote em 'C:/Users/jaeds/AppData/Local/R/win-library/4.5'
(como 'lib' não foi especificado)
pacote 'ggplot2' desempacotado com sucesso e somas MD5 verificadas

Os pacotes binários baixados estão em
    C:\Users\jaeds\AppData\Local\Temp\RtmpykLxJp\downloaded_packages
#carregar bibliotecas
library(tidyverse)
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr     1.1.4     ✔ readr     2.1.5
✔ forcats   1.0.0     ✔ stringr   1.5.2
✔ ggplot2   4.0.0     ✔ tibble    3.3.0
✔ lubridate 1.9.4     ✔ tidyr     1.3.1
✔ purrr     1.1.0     
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag()    masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(readxl)
library(janitor)

Anexando pacote: 'janitor'

Os seguintes objetos são mascarados por 'package:stats':

    chisq.test, fisher.test
library(lubridate)
library(scales)

Anexando pacote: 'scales'

O seguinte objeto é mascarado por 'package:purrr':

    discard

O seguinte objeto é mascarado por 'package:readr':

    col_factor
library(ggplot2)
library(dplyr)

#4)USANDO A TABELA 7060 DO SIDRA MONTE UMA TABELA COMPARANDO O IPCA DO BRASIL, RIO DE JANEIRO E SALVADOR. USANDO AS FERRAMENTAS DO TIDYVERSE NA MONTAGEM DA TABELA. USE O PACOTE LUBRIDATE PARA MONTAR A COLUNA DE DATAS DA TABELA?

getwd()
[1] "C:/Users/jaeds/OneDrive/Documentos"
arquivo <- "C:/Users/jaeds/OneDrive/Documentos/tabela7060.xlsx"

#Ler a aba "Tabela" pulando as primeiras linhas descritivas
dados <- read_excel(arquivo, sheet = "Tabela", skip = 4)
New names:
• `` -> `...1`
#Renomear colunas principais
colnames(dados) <- c("Mês", "Brasil", "Salvador_BA", "Rio_de_Janeiro_RJ")

#Filtrar apenas os meses válidos
dados_limpos <- dados %>%
  filter(!is.na(Mês)) %>%
  select(Mês, Rio_de_Janeiro_RJ, Salvador_BA)

#Mostrar a tabela comparativa
print(dados_limpos)
# A tibble: 14 × 3
   Mês                                             Rio_de_Janeiro_RJ Salvador_BA
   <chr>                                                       <dbl>       <dbl>
 1 agosto 2024                                                  2.42        2.68
 2 setembro 2024                                                2.96        2.96
 3 outubro 2024                                                 3.58        3.46
 4 novembro 2024                                                4.09        3.75
 5 dezembro 2024                                                4.69        4.68
 6 janeiro 2025                                                 0.06        0.38
 7 fevereiro 2025                                               1.46        1.76
 8 março 2025                                                   2.01        2.18
 9 abril 2025                                                   2.17        2.34
10 maio 2025                                                    2.38        2.71
11 junho 2025                                                   2.46        3   
12 julho 2025                                                   2.71        3.02
13 agosto 2025                                                  2.35        2.94
14 Fonte: IBGE - Índice Nacional de Preços ao Con…             NA          NA   
#instalar pacotes
install.packages("tidyverse")
Warning: o pacote 'tidyverse' está em uso e não será instalado
install.packages("readxl")
Warning: o pacote 'readxl' está em uso e não será instalado
install.packages("janitor")
Warning: o pacote 'janitor' está em uso e não será instalado
install.packages("lubridate")
Warning: o pacote 'lubridate' está em uso e não será instalado
install.packages("dplyr")
Warning: o pacote 'dplyr' está em uso e não será instalado
install.packages("stringr")
Warning: o pacote 'stringr' está em uso e não será instalado
install.packages("scales")
Warning: o pacote 'scales' está em uso e não será instalado
install.packages("ggplot2")
Warning: o pacote 'ggplot2' está em uso e não será instalado
#carregar bibliotecas
library(tidyverse)
library(readxl)
library(janitor)
library(lubridate)
library(scales)
library(ggplot2)
library(dplyr)

#5) USE WEBSCRAPING PARA PEGAR DADOS SOBRE O PIB E PIB per capita, TABELA 6784 DO SIDRA. MONTE UMA TABELA NO R COM OS DADOS COLETADOS. APRESENTE UM GRÁFICO USANDO GGPLOT2 COM OS VALORES DO PIB PER CAPITA.

dados <- read_excel("C:/Users/jaeds/OneDrive/Documentos/tabela6784.xlsx")
New names:
• `` -> `...2`
• `` -> `...3`
head(dados)
# A tibble: 6 × 3
  Tabela 6784 - Produto Interno Bruto, Produto Interno Bruto per c…¹ ...2  ...3 
  <chr>                                                              <chr> <chr>
1 Brasil                                                             <NA>  <NA> 
2 Ano                                                                Vari… <NA> 
3 <NA>                                                               PIB … PIB …
4 2005                                                               2170… 1170…
5 2006                                                               2409… 1284…
6 2007                                                               2720… 1435…
# ℹ abbreviated name:
#   ¹​`Tabela 6784 - Produto Interno Bruto, Produto Interno Bruto per capita, População residente e Deflator`
colnames(dados) <- c("Ano", "PIB_milhoes", "PIB_percapita")

dados_long <- dados %>%
  select(Ano, PIB_milhoes, PIB_percapita) %>%
  tidyr::pivot_longer(cols = c(PIB_milhoes, PIB_percapita),
                      names_to = "Indicador",
                      values_to = "Valor")

ggplot(dados_long, aes(x = Ano, y = Valor, color = Indicador, group = Indicador)) +
  geom_line(size = 1.2) +
  geom_point() +
  labs(
    title = "Comparação do PIB Total e PIB per Capita",
    x = "Ano",
    y = "Valor",
    color = "Indicador"
  ) +
  theme_minimal()
Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
ℹ Please use `linewidth` instead.

arquivo <- "C:/Users/jaeds/OneDrive/Documentos/tabela6784.xlsx"

dados <- read_excel(arquivo, sheet = "Tabela", skip = 3)
New names:
• `` -> `...1`
colnames(dados) <- c("Ano", "PIB_milhoes", "PIB_percapita")

dados_pib <- dados %>%
  filter(!is.na(Ano)) %>%
  select(Ano, PIB_milhoes, PIB_percapita)

print(dados_pib)
# A tibble: 19 × 3
   Ano                                   PIB_milhoes PIB_percapita
   <chr>                                       <dbl>         <dbl>
 1 2005                                      2170585        11700.
 2 2006                                      2409450        12848 
 3 2007                                      2720263        14358.
 4 2008                                      3109803        16253.
 5 2009                                      3333039        17254.
 6 2010                                      3885847        19953.
 7 2011                                      4376382        22310.
 8 2012                                      4814760        24357.
 9 2013                                      5331619        26762.
10 2014                                      5778953        28778.
11 2015                                      5995787        29623.
12 2016                                      6269328        30751.
13 2017                                      6592743        32126.
14 2018                                      6996861        33878.
15 2019                                      7394332        35567.
16 2020                                      7609597        36381.
17 2021                                      9012142        42894.
18 2022                                     10079677        47802.
19 Fonte: IBGE - Contas Nacionais Anuais          NA           NA