QG2 | PROVA ANNE VITORIA

Nome: Anne Vitória Dornelas Reis

Instruções:

Responda a prova neste documento Quarto. Antes de cada chunk explique o comando que será rodado. Não é necessário renderizar o arquivo. Salve-o com terminação qmd e o envie para o endereço dinilson.pedroza@unicap.br. Esse envio deve acontecer até às 22:00min. Não serão considerados envios posteriores a essa hora. Toda e qualquer consulta é proibida. Caso o aluno ou aluna recorra a algum tipo de consulta sua prova será anulada. O arquivo deve estar pronto para, na correção, ele produzir os resultados demandados. Atenção: lembre-se de carregar os packages necessários à prova com a função library.

1. Use o pacote sidrar para coletar dados sobre a produção industrial mensal do Brasil (Tabela 8888 do Sidra/IBGE, Variável: PIMPF - Número-índice (2022=100) (Número-índice); Seções: Indústria geral; Mês: todos; Unidade Territorial: Brasil). Depois que baixar o data frame por web scraping, crie outro data frame apenas com os dados de valor e mês (colunas “Valor” e “Mês (Código)” da tabela baixada). Use os operadores pipe, select (para selecionar as colunas) e mutate (para aplicar a função as.numeric às colunas separadas). Lembre-se usar a função arrange para ordenar os dados por mês. 4 pontos.

Resposta:

acesso a Tabela 8888 através do sidrar, extraindo todos os registros da produção industrial. Posteriormente, mantenho apenas as colunas essenciais e ajusto os valores numéricos, organizando o data frame em ordem crescente.

library(sidrar)
library(dplyr)

Anexando pacote: 'dplyr'
Os seguintes objetos são mascarados por 'package:stats':

    filter, lag
Os seguintes objetos são mascarados por 'package:base':

    intersect, setdiff, setequal, union
pim <- get_sidra(
  api = "/t/8888/n1/all/v/12606/p/all/c544/129314/d/v12606%205"
)
All others arguments are desconsidered when 'api' is informed
dados <- pim %>%
  select(`Mês (Código)`, Valor) %>%
  mutate(
    Valor = as.numeric(sub(",", ".", Valor)),
    `Mês (Código)` = as.numeric(`Mês (Código)`)
  ) %>%
  arrange(`Mês (Código)`)

head(dados)
  Mês (Código)    Valor
1       200201 84.35985
2       200202 81.23882
3       200203 90.19468
4       200204 92.75477
5       200205 93.74586
6       200206 90.30861

2. Transforme o data frame que você limpou em série temporal, começando em c(2002, 01). visualize a série. 3 pontos.

Resposta:

converto os dados limpos para o objeto ts, iniciando a série em 2002. Em seguida, utilizo o autoplot para gerar o gráfico da produção industrial ao longo do tempo.

library(ggplot2)
library(forecast)
Warning: pacote 'forecast' foi compilado no R versão 4.5.2
Registered S3 method overwritten by 'quantmod':
  method            from
  as.zoo.data.frame zoo 
dados_ts <- ts(
  dados$Valor,
  start = c(2002, 1),
  frequency = 12
)

autoplot(dados_ts) +
  ggtitle("Série Temporal - Produção Industrial (IBGE)") +
  ylab("Número-Índice (2022 = 100)") +
  xlab("Ano") +
  theme_minimal()

3. Use a função decompose para separar a série em seus componentes. Fale brevemente sobre o resultado. 3 pontos.

Resposta:

aplico a função decompose para separar a série temporal em seus componentes estruturais: tendência, sazonalidade e parte irregular. O autoplot é utilizado para exibir cada componente graficamente.

decomp <- decompose(dados_ts)

autoplot(decomp)
Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
ℹ Please use `linewidth` instead.
ℹ The deprecated feature was likely used in the forecast package.
  Please report the issue at <https://github.com/robjhyndman/forecast/issues>.