Neste curso vamos ajudá-lo a conhecer uma importante ferramenta de um cientista de dados, que é a capacidade de criar cenários e estar apto a responder à questão: “E se isso acontecer…”. Vamos explorar os modelos univariados e multivariados; calcular elasticidades, trabalhar com séries temporais com discretização diária, semanal, mensal e anual, fazer previsões dentro e fora da amostra e criar cenários baseados em diferentes conjunturas econômicas.
O curso Análise de Séries Temporais: Predictive Analytics for Business é uma parte dessa grande área chamada Data Science e está caucado em três objetivos fundamentais: (i) discutir o estado da arte no contexto de séries temporais e aprender conceitos fundamentais para a caracterização, modelagem e previsão de uma série temporal; (ii) discutir os modelos univariados com enfoque para os modelos (S)ARIMA e mostrar pacotes que automatizam o uso desses modelos; (iii) modelagem multivariada: Regressão Dinâmica ou ADL(Autoregressive Distributed Lag). Modelaremos a venda de sorvetes com o intuito de criar cenários e estimar elasticidades.
Este é um curso de 30 horas-aula. Ao final do curso, o aluno terá muitas respostas, no entanto, certamente, novas questões irão emergir. Espera-se que o aluno, ao final do curso, tenha uma boa visão sobre o que é ciência de dados e como chegamos até aqui. Conheça e aprenda a manusear uma importante ferramenta de análise de dados, o software R. Nessa plataforma, serão apresentados importantes pacotes para análise e visualização de dados. Por fim, conceitos estatísticos importantes serão abordados.
Para melhor aproveitar o curso o aluno deve: (i) estudar pelo menos 3 horas para cada hora-aula assistida; (ii) fazer toda a lista de exercícios; (iii) começar a pensar a relação entre o que foi aprendido em sala de aula e o seu dia a dia; e, (iv) pensar/estudar coisas novas.
Leve esse curso para sua empresa. Entre em contato com a Model Thinking Br: contato@modelthinkingbr.com [cursos in company MTBr]
Apresentação professor + alunos (nome, empresa, o que espera do curso?) + Apresentação do curso “Análise de séries temporais”
Big Data: New Tricks for Econometrics. Hal R. Varian
Forecasting, nowcasting, backcasting: Dashboard do PIB1 https://pedroferreira.shinyapps.io/dashboardpib/; Nowcasting: R Package for Forecasting Models with Real Time Data2 Disponível aqui; Nowcasting e o acompanhamento da atividade econômica em tempo real (Ferreira et. al. (2018Ferreira et. al. 2018. “Nowcasting E O Acompanhamento Da Atividade Econômica Em Tempo Real.” Blog do IBRE. https://goo.gl/eJ7h2r.)); Forecasting, nowcasting and backcasting Brazilian GDP3 https://goo.gl/Z9WvFF; R package Nowcasting4 https://cran.r-project.org/web/packages/nowcasting/index.html
Forecasting da Produção industrial [SARIMA Structural Model; Dynamic Factor Models; Linear Regression; Linear Regression 2; LASSO; Ridge Regression; Regression Tree; Random Forest]
CRAN Task View: Time Series Analysis5 https://cran.r-project.org/web/views/TimeSeries.html
Exercício em grupo: análise de séries
Séries Temporais em diferentes frequências
Sazonalidade ou Ciclo
Referências para estudo
Ferreira, P. G. C. et. al. Análise de Séries Temporais em R: curso introdutório. 1 ed. - Rio de Janeiro: Elsevier: FGV IBRE, 2018. 264p.
Forecasting: Principles and Practice, Hyndman & Athanasopoulos (2nd ed., 2018)6 This textbook is intended to provide a comprehensive introduction to forecasting methods and to present enough information about each method for readers to be able to use them sensibly. Available here
Forecasting Using R - Datacamp: whatever the circumstances or time horizons involved, forecasting is an important aid to effective and efficient planning. This course provides an introduction to time series forecasting using R.
Caracterização, Modelagem e Previsão de uma série temporal: (i) uma série temporal (ST) é um conjunto de observações, geralmente equiespaçadas, obtidas a partir da observação de uma variável ao longo do tempo; (ii) a frequência de medição de uma ST pode variar dependendo do fenômeno observado: minuto, diária, semanal, mensal, anual etc; (iii) a partir da análise de ST, é possível obter subsídios para a escolha de um modelo adequado para modelar a série, escolhido dentro de uma classe de modelos pré-existentes; (iv) uma vez construído, um modelo de ST pode ser utilizado para efetuar previsões probabilísticas sobre o futuro da série e/ou analisar a sensibilidade de algumas variáveis à variável objetivo; (v)a capacidade de realizar previsões é fundamental no processo de tomada de decisões em diversos contextos e em diversos lugares como orgãos públicos e empresas.
Função de autocorrelação (ACF)
Processo Ruído Branco (white noise)
if(!require(tseries)) install.packages("tseries")
library(tseries)
set.seed(1)
wn<-arima.sim(model=list(),n=100)
plot.ts(wn)
forecast::Acf(wn)
Intervalo de confiança
Valores ajustados e resíduos
Acurácia dos modelos de previsão
Exercício: Crie um modelo NAIVE e SNAIVE para a ST de produção de cerveja na Austrália. Interprete os resultados. [ps. lembre-se de criar os grupos de treinamento e teste]
Referências para estudo
Ferreira, P. G. C. et. al. Análise de Séries Temporais em R: curso introdutório. 1 ed. - Rio de Janeiro: Elsevier: FGV IBRE, 2018. 264p.
Modelos de Holt Winters: decomposição de uma série temporal; Suavização exponencial simples (SES); Suavização exponencial de Holt (SEH); Suavização exponencial sazonal de Holt-Winters
Modelos (S)ARIMA: Processos Auto-Regressivos - AR(p); Processos Médias Móveis – MA(q); Processos Auto-Regressivos de Médias Móveis – ARMA(p,q); Função de Autocorrelação - FAC; Função de Autocorrelação Parcial – FACP; Identificação; Estimação; Diagnóstico dos Resíduos; Previsão.
Previsão das vendas de passagens aéreas utilizando os modelos (S)ARIMA7 http://rpubs.com/modelthinkingbr/AirPassengers
BETS package e a previsão da produção de bens intermediários8 http://rpubs.com/modelthinkingbr/bets
Exercício: Crie um modelo NAIVE, SNAIVE, Holt Winters e SARIMA para a ST de vendas de passagens aéreas (AirPassengers). Interprete os resultados. [ps. 1- lembre-se de criar os grupos de treinamento e teste; 2 - crie uma tabela para comparar os MAPEs dos modelos; 3 - Interprete o teste de Ljung-Box]
Referências para estudo
Ferreira, P. G. C. et. al. Análise de Séries Temporais em R: curso introdutório. 1 ed. - Rio de Janeiro: Elsevier: FGV IBRE, 2018. 264p. [capítulos 2 e 4]
R para data science: Manipulação de dados utilizando os pacotes do tidyverse(). Material de estudo disponível no RPubs da MTBr
Getting Started With Data and dplyr: este curso introduz dois importantes pacotes para a manipulação e visualização de dados, o dplyr e o plotly.
Resolução do Exercício: Crie um modelo NAIVE, SNAIVE, Holt Winters e SARIMA para a ST de vendas de passagens aéreas (AirPassengers). Interprete os resultados. [ps. 1- lembre-se de criar os grupos de treinamento e teste; 2 - crie uma tabela para comparar os MAPEs dos modelos; 3 - Interprete o teste de Ljung-Box]
Modelos dinâmicos9 Material de Apoio: introdução a Regressão dinâmica; construção de modelos;
Previsão e estudo das elasticidades da série temporal de venda de sorvete10 Business forecasting: Previsão e estudo das elasticidades da série temporal de venda de sorvete
Modelando o PIB de FIJI
A economia de Fiji é uma das mais desenvolvidas do Oceano Pacífico. A exportação de açúcar, as remessas de dinheiro feitas por fijianos residentes no exterior, e o turismo (de 300 a 400 mil turistas por ano visitam o país) são as principais fontes de receitas do país;
O açúcar fijiano tem como destino principal a União Europeia. Em 2007 a ajuda econômica da UE ao país foi suspensa, enquanto o governo que assumiu o poder após o golpe de estado não estabelece um cronograma para novas eleições.
Exercício: Crie um modelo NAIVE, SNAIVE, Holt Winters, SARIMA e SARIMAX para a ST da produção industrial brasileira. Interprete os resultados. [ps. 1- lembre-se de criar os grupos de treinamento e teste; 2 - crie uma tabela para comparar os MAPEs dos modelos; 3 - Interprete o teste de Ljung-Box; 4 - Ajuste o modelo com a variável explicativa de produção de veículos da Anfave; 5 - crie uma dummy para tentar corrigir a quebra estrutural da série temporal]
Referências para estudo
Tidyverse11 tidyverse.org: R packages for data science
Brainstorm Time Series Analysis: vamos discutir os principais pacotes de automação para análise de séries temporais, suas aplicações e limitações
Fitting Bayesian structural time series with the bsts R package
Previsões automáticas: forecastHybrid - Convenient Functions for Ensemble Time Series Forecasts; TSstudio - Set of tools for descriptive and predictive analysis…; mafs - Multiple Automatic Forecast Selection
Previões automáticas com o pacote Prophet: library(prophet); make_future_dataframe(); predict(); cross_validation(); London wheater
Prophet12 research.fb.com: forecasting at scale
Machine learning + Time series: Regularization and Shrinkage estimators: Ridge regression, LASSO, elastic NET
caret: Classification and Regression Training
glmnet: Lasso and Elastic-Net Regularized GLM
mlbench: Machine Learning Benchmark Problems
Previsão da produção industrial: estudo de caso usando o pacote forecast e os pacotes do Tidyverse : forecast; dplyr, purrr; broom; tidyr; ggrepel; ggplot2; MASE13 A scaled error is less than one if it arises from a better forecast than the average naïve forecast computed on the training data. Conversely, it is greater than one if the forecast is worse than the average naïve forecast computed on the training data.
In-house production (incerteza, Coca, SEB, anti-fraude); data science lab; digital transformation - Nosso objetivo é discutir alguns projetos desenvolvidos em casa e comentar sobre os desafios, dificuldades, frustrações e vitórias.
Referências para estudo
Garrett Grolemund and Hadley Wickham. R for Data Science: this book will teach you how to do data science with R: You’ll learn how to get your data into R, get it into the most useful structure, transform it, visualise it and model it. [lubridate - capítulo 16]
Instalando o R: (i) Vá no site cran.r-project.org (R-3.5.0 for Windows); (ii) Faça download do arquivo e clique em executar [para melhor performance instale a versão 64 bits]
Instalando o RStudio: (i) Vá no site rstudio.com; (ii) Clique em download; (iii) Escolha a versão free; (iv) Faça o download do Arquivo e clique em executar.
Pacotes R para Data Science
install.packages(c("tidyverse", "pipeR", "nycflight", "BETS", "AER", "MASS",
"ggrepel", "ggplot2", "forecast", "dplyr", "tidyr", "purrr",
"broom"))
library(devtools)
install.packages()
#Não deixe de testar os pacotes:
library(nome do pacote)
Material complementar: envie e-mail para pedro@modelthinkingbr.com com o título “MBA-AST - adicionar no dropbox”
Model Thinking Br14 Model Thinking Br
contato@modelthinkingbr.com [cursos in company MTBr]