Primeiro GQ

Author

Emilly Denise da Silva Nascimento

1º GQ - Laboratório de Dados

2º) A Ciência de Dados é importante para economia pois suas ferramentas contribuem para o auxílio das análises estatísticas e econometricas. As linguagens de programação (fruto da ciência de dados) facilitam análises com muitos dados e nos dão a possibilidade de fazer análises mais robustas de forma mais rápida e analítica. O tidyverse é um pacote do R que contém diversas funções diferentes para fazer análises. Entre algumas atribuições dele estão: dplyr, readr, forcats, stringr, ggplot2, tibble, lubridate, tidyr, purrr. Ele nos permite fazer funções como select, filter, mutate, ggplot, etc.

Select nos permite selecionar as colunas que queremos visualizar e trabalhar. O filter nos permite filtrar os elementos que estão nas linhas. Os dois são muito interessantes para a análise de dados pois pode reduzir volumes enormes de dados em um volume muito menor, deixando apenas o que possa interessar para a análise.

3º) R e Python são softwares de código aberto e Softwares livres porque permitem que os usuários façam melhorias na linguagem e permitem o uso das linguagens de programação de forma gratuita, com o intuito de disseminar o conhecimento em programação.

4º)

setwd ("C:/Users/Émilly/OneDrive - Universidade Católica de Pernambuco/Documentos/pasta")
library(tidyverse)
── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
✔ dplyr     1.1.4     ✔ readr     2.1.5
✔ forcats   1.0.0     ✔ stringr   1.5.2
✔ ggplot2   3.5.2     ✔ tibble    3.3.0
✔ lubridate 1.9.4     ✔ tidyr     1.3.1
✔ purrr     1.1.0     
── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
✖ dplyr::filter() masks stats::filter()
✖ dplyr::lag()    masks stats::lag()
ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
ipca <- read.csv2("ipca.csv")
head(ipca)
     Mês Brasil    PE    BA
1 set/23   0.26  0.05  0.05
2 out/23   0.24 -0.09  0.29
3 nov/23   0.28 -0.29 -0.17
4 dez/23   0.56  0.21  0.84
5 jan/24   0.42  0.63  0.13
6 fev/24   0.83  0.74  0.96
Mês <- seq.Date(from = as.Date("2023-09-01"),
                to   = as.Date("2025-08-01"),
                by   = "month")
ipca$Mês<-Mês
head(ipca)
         Mês Brasil    PE    BA
1 2023-09-01   0.26  0.05  0.05
2 2023-10-01   0.24 -0.09  0.29
3 2023-11-01   0.28 -0.29 -0.17
4 2023-12-01   0.56  0.21  0.84
5 2024-01-01   0.42  0.63  0.13
6 2024-02-01   0.83  0.74  0.96

library(tidyverse)
library(sidrar)

pib_ibge <- get_sidra(api ="/t/6784/n1/all/v/9808,9812/p/last%2020/d/v9812%202")
All others arguments are desconsidered when 'api' is informed
class(pib_ibge)
[1] "data.frame"
subtab_pibn <- pib_ibge[pib_ibge$Variável=="PIB - valores correntes",]
subtab_pibpc <- pib_ibge[pib_ibge$Variável=="PIB per capita - valores correntes",]
class(subtab_pibn)
[1] "data.frame"
subtab_pibn%>%
  select(Ano, Valor)
    Ano    Valor
2  2003  1717950
3  2004  1957751
4  2005  2170585
5  2006  2409450
6  2007  2720263
7  2008  3109803
8  2009  3333039
9  2010  3885847
10 2011  4376382
11 2012  4814760
12 2013  5331619
13 2014  5778953
14 2015  5995787
15 2016  6269328
16 2017  6592743
17 2018  6996861
18 2019  7394332
19 2020  7609597
20 2021  9012142
21 2022 10079677
subtab_pibpc%>%
  select(Ano, Valor)
    Ano    Valor
22 2003  9471.66
23 2004 10670.69
24 2005 11700.13
25 2006 12848.00
26 2007 14358.06
27 2008 16253.18
28 2009 17254.08
29 2010 19953.10
30 2011 22310.38
31 2012 24357.44
32 2013 26761.53
33 2014 28778.07
34 2015 29622.87
35 2016 30751.29
36 2017 32126.50
37 2018 33878.35
38 2019 35566.77
39 2020 36380.83
40 2021 42893.72
41 2022 47802.02