1 - Objetivo

Treinar profissionais formados em Economia e detentores de boa base quantitativa (Matemática, Estatística e Econometria) para o uso profissional de ferramentas de Data Science. A extensão irá ajudar o aluno a adquirir o conjunto de habilidades necessárias para o uso de Ciência de Dados. Negócios e Computação, de maneira ampla, e Machine e Deep Learning, no campo de Ciência e Matemática, conforme diagrama abaixo.

Habilidades necessárias para a resolução de problemas usando Ciência de Dados.

2 - Perfil do Egresso

O profissional que terminar o curso será capaz de implementar e liderar equipes de Ciência de Dados para modelos de Machine Learning e Inteligência Artificial com fins de executar e formular estratégias de negócios baseadas em dados. Como diferencial, a extensão prepara os alunos para avaliarem criticamente dados e modelos com base em sólidos fundamentos econômicos e analíticos. Ressalte-se que essas já são característicos das formações oferecidas pela FGV EPGE.

3 - Networking

Ao longo da extensão os alunos entrarão em contato com profissionais e empreendedores destacados por meio da disciplina Estratégia de Negócios Baseadas em Dados. Além da transmissão de conhecimento, os alunos terão a oportunidade estreitar relações com estes profissionais.

4 - Projetos

Cada aluno deverá escolher projetos profissionais para se dedicarem deste o primeiro dia da extensão. Os projetos deverão ser aplicações de Ciência de Dados em Economia e Finanças. São esperadas aplicações em análise de crédito, marketing, análise de churn, segmentação de clientes etc.

5 - Avaliações

Os projetos serão utilizados como avaliação nas disciplinas. Na disciplina de Estratégia de Negócios Baseadas em Dados os alunos farão apresentações baseadas na bibliografia sugeria pelos profissionais convidados.

6 - Disciplinas da Extensão

6.1 - Estratégia de Negócios Baseadas em Dados

Professores: Genaro Lins e Rafael Martins de Souza

Carga horária: 45 horas

Objetivo principal: Desenvolver nos alunos, por meio da interação com profissionais e empreendedores destacados e por meio de leituras e debates, as habilidades de liderança, comunicação, visão de negócio, empreendedorismo e inovação no desenvolvimento de soluções de problemas de negócio por meio de Ciência de Dados.

Tópicos:

  • Soft skills necessários para o sucesso na aplicação do Data Sciente em negócios: Liderança, Empreendedorismo, Comunicação, Visão de Negócios e Inovação.

Referências:

  • Apontadas pelos convidados durante os seminários.

6.2 - Introdução à Python para Ciência de Dados

Professor: Rafael Martins de Souza

Carga horária: 45 horas

Objetivo: Fornecer habilidades em programação para Data Science.

Tópicos:

  • Apresentação da cases de aplicação de Ciência de Dados em Economia;

  • Sintaxe e semântica da linguagem;

  • Estruturas de dados em Python;

  • Objetos: Variáveis e Funções (métodos);

  • Operadores e métodos relacionados, Indexação, slicing, listas, nesting de listas;

  • Tipos booleanos;

  • Indexação (no caso de dicionários); Conversão de tipos;

  • Navegação em listas com for, range() e enumerate();

  • Programação funcional: map, reduce, filter, zip, all, any, lambda e passagem de funções como parâmetros;

  • Álgebra Linear e manipulação de matrizes com Numpy;

  • Manipulação de bancos de dados com Pandas;

  • Visualização de dados com MatplotLib, Plotly e Altair.

Referência Básica:

  • McKinney, W. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython (English Edition), 2nd, O’Reilly Media, 2017.

Referência Complementares:

  • Consoli, S., Recupero, , D. R., Saisana, M. (Ed.), Data Science for Economics and Finance Methodologies and Applications, Springer, 2021.

  • Athey, S., The Impact of Machine Learning on Economics, The Economics of Artificial Intelligence: An Agend, University of Chicago Press, May 2019.

  • Gogas, P., Papadimitriou, T. Machine Learning in Economics and Finance. Comput Econ 57, 1–4, 2021. Disponível em https://doi.org/10.1007/s10614-021-10094-w.

6.3 - Aprendizado de Máquinas (Machine Learning) Aplicado à Economia

Professor: Rafael Martins de Souza

Carga horária: 45 horas

Objetivo principal: Permitir que os alunos sejam proeficientes na implementação de modelos de Machine Learning.

Tópicos:

  • O Cenário do Aprendizado de Máquina e suas Aplicações em Economia;

  • Projeto de Aprendizado de Máquina Ponta a Ponta;

  • O MQO e O Gradiente Descendente;

  • Classificação;

  • Treinando Modelos;

  • Máquinas de Vetores de Suporte;

  • Árvores de Decisão;

  • Aprendizado Ensemble e Florestas Aleatórias;

  • Redução de Dimensionalidade;

  • Técnicas de Aprendizado Não Supervisionado.

  • Cases em Economia.

Referência Básica:

  • Gueron, A., Hands-On Machine Learning with Scikit-Learn, Keras, and Tensorflow: Concepts, Tools, and Techniques to Build Intelligent Systems, O’Reilly Media; 2nd ed., October 2019.

Referências Complementares:

  • Consoli, S., Recupero, D. R., Saisana, M. (Ed.), Data Science for Economics and Finance Methodologies and Applications, Springer, 2021.

  • Fasolo, A. M., Graminho, F. M., Bastos, S. B., Seeing the Forest for the Trees: Using hLDA Models to Evaluate Communication in Banco Central do Brasil, Working Paper Series 555, Banco Central do Brasil, August 2021.

6.4 - Aprendizado Profundo (Deep Learning) e Inteligência Artificial (AI) Aplicados à Economia

Professor: Renato Rocha
Carga horária: 45 horas

Objetivo principal: Permitir que os alunos sejam proeficientes na implementação de modelos de Deep Learning e Inteligência Artifical.

Tópicos:

  • Introdução a Redes Neurais (RN) e Deep Learning (DL);

  • Bibliotecas do Python para RN e DN (Tensor Flow, Keras e Pytorch);

  • Redes Neurais Convolunionais;

  • Redes Neurais Recorrentes (RNN), Long Short Term Memory (LSTM) e (Gated Recurrent Unit) (GRU);

  • Processamento de Linguagem Natural (NLP) com RNN, LSTM, GRU;

  • Séries de Temporais com Redes Neurais;

  • Reinforcement Learning;

  • Generative Models;

  • Autoencoders;

  • GANs;

  • Deploying Models;

  • Graph Convolutional Neural Networks;

  • Deployment de modelos com Docker.

Referência em Redes Neurais:

  • Gueron, A., Hands-On Machine Learning with Scikit-Learn, Keras, and Tensorflow: Concepts, Tools, and Techniques to Build Intelligent Systems, O’Reilly Media; 2nd ed., October 2019.

Referências de Aplicações em Economia:

  • Consoli, S., Recupero, D. R., Saisana, M. (Ed.), Data Science for Economics and Finance Methodologies and Applications, Springer, 2021.

  • Henderson, J. Vernon, Adam Storeygard, and David N. Weil. 2012. “Measuring Economic Growth from Outer Space.” American Economic Review, 102 (2): 994-1028.DOI: 10.1257/aer.102.2.994, <Measuring Economic Growth from Outer Space - American Economic Association (aeaweb.org) >.

  • Donaldson, Dave, and Adam Storeygard. 2016. “The View from Above: Applications of Satellite Data in Economics.” Journal of Economic Perspectives, 30, 4. The View from Above: Applications of Satellite Data in Economics - American Economic Association.

  • Hoberg, G., Maksimovic, V., Redefining Financial Constraints: A Text-Based Analysis, The Review of Financial Studies, Volume 28, Issue 5, May 2015, Pages 1312–1352, https://doi.org/10.1093/rfs/hhu089.

  • Hansen, S., McMahon, M., Shocking language: Understanding the macroeconomic effects of central bank communication, Journal of International Economics, Volume 99, Supplement 1, 2016, Pages S114-S133, ISSN 0022-1996, https://doi.org/10.1016/j.jinteco.2015.12.008.

  • Hansen, S., Mcmahon, M., Prat, A., transparency And Deliberation Within The Fomc: A Computational Linguistics Approach, The Quarterly Journal of Economics (2018), 801–870.

  • Gentzkow, M., Kelly, B., Taddy, M., Journal of Economic Literature 2019, 57(3), 535–574,https://doi.org/10.1257/jel.20181020.

  • Algaba, A., Ardia, D., Bluteau, K., Borms, S. and Boudt, K. (2020), Econometrics Meets Sentiment: An Overview of Methodology and Applications, Journal of Economic Surveys, 34: 512-547, https://doi.org/10.1111/joes.12370.

6.5 - Computação para Data Science: Bancos de Dados e Tecnologias de TI

Professor: Júlio César Chaves

Carga horária: 45 horas

Objetivo principal: Fornecer ao aluno o conhecimento de Tecnologia da Informação necessário para que ele possa interagir em alto nível com profissionais da área e liderar equipes de Ciência de Dados.

Tópicos:

  • Modelo Entidade-Relacionamento.

  • Tipos de entidades, conjuntos de entidades e atributos-chaves.

  • Tipos de relacionamentos, papéis e restrições estruturais.

  • Diagrama Entidade-Relacionamento.

  • Modelo de Dados Relacional. Atributos-chaves de uma relação.

  • Esquemas de Bases de Dados Relacionais e Restrições de integridade.

  • Linguagens Formais de Consulta: Álgebra Relacional.

  • A linguagem SQL. Bancos de Dados NoSQL. Bancos de Dados RDF.

  • Gremilin e funções analíticas SQL.

  • Formatos de Dados. Modelagem Dimensional e Modelos de Dados.

  • Dados Estruturados e Dados não Estruturados.

  • Extração, Transformação e Carga (ETL e ELT).

  • Dados em Streaming. Projetos de Data Warehouse e Data Lake.

  • Sistemas e Melhores Práticas para Gestão de Big Data.

  • Plataformas de cloud;

  • Ferramentas de big data (Spark, Airflow, Nifi);

  • Devops (Docker, CI/CD, etc) e MLops;

  • Gestão e Governança de dados e LGPD.

Referências:

  • Jukic, N., Vrbsky, S., Nestorov, S., & Sharma, A. (2021). Database Systems: An Introduction to Databases and Data Warehouses.

  • David Hay. Data Model Patterns: a metadata map. Morgan Kaufmann, 2006.

  • Kimball, R., & Ross, M. (2013). The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, 3rd ed.; I. John Wiley & Sons.

  • Sharma, B. (2018). Architecting Data Lakes. O’Reilly Media, Inc. http://www.oreilly.com/data/free/architecting-data-lakes.csp.

  • Bill Inmom. Data Lake Architecture: Designing the Data Lake and Avoiding the Garbage Dump.

  • Rêgo, B. L. (2013). Gestao e Governanca de Dados: Promovendo Dados Como Ativo de Valor nas Empresas, S. M. de Oliveira, ed. 

  • Seidl, M., Scholz, M., Huemer, C., & Kappel, G. (2015). UML @ classroom : an introduction to object-oriented modeling. Springer International Publishing.

7 - Demais Disciplinas Quantitativas do Mestrado

7.1 - Introdução à Ciência de Dados Aplicada à Economia

Professor: Rafael Martins de Souza

Carga horária: 45 horas

Objetivo principal: Permitir que os alunos do Mestrado Profissional em Economia e Finanças da FGV EPGE sejam capazes de utilizar o R em suas atividades profissionais relacionadas à Ciência de Dados, Econometria e Estatística.

Tópicos:

  • Apresentação do R e dos ambientes de programação em R;

  • Introdução à Programação em R;

  • Variáveis em R;

  • Estrutura de Dados em R;

  • Estruturas de Controle;

  • Funções;

  • Captura de Dados Nacionais;

  • Captura de Dados Internacionais;

  • Visualização de Dados;

  • Analise Exploratória de Dados.

Referências:

7.2 - Estatística

Professor: Edudardo Campos

Carga horária: 45 horas

Objetivo principal: Apresentar e consolidar os conceitos mais importantes da teoria estatística, com ênfase nas aplicações em economia e finanças.

Tópicos:

  • Estatística Descritiva;

  • Probabilidade e Variáveis Aleatórias;

  • Distribuições de Probabilidade;

  • Estimação;

  • Intervalos de Confiança;

  • Testes de Hipóteses.

Referências:

  • Notas de Aula do Professor Eduardo Campos, disponibilizadas na página wiki.

  • KELLER. Statistics for Management and Economics. 9th ed. Thomson, 2011.

  • LARSON. Introduction to Probability and Statistical Inference. 3rd ed., 1982.

7.3 - Econometria

Professor: Pedro Engel

Carga horária: 60 horas

Objetivo principal: Capacitar o aluno para o desenvolvimento de trabalhos empíricos nas diferentes áreas de economia através do uso de software econométrico R e de técnicas sofisticadas de estatística e econometria.

Tópicos:

  • Análise de Regressão;

  • O método de mínimos quadrados;

  • Inferência estatística no modelo de regressão linear;

  • Regressão Múltipla;

  • Interpretação dos coeficientes de regressão;

  • Análise de variância e teste de hipótese;

  • Variáveis omitidas e variáveis irrelevantes;

  • O Coeficiente R2;

  • A estatística de Wald;

  • Violações das suposições do modelo de regressão linear;

  • Heterocedasticidade;

  • Multicolinearidade;

  • Variáveis Dummy;

  • Método de estimação: o método de variável instrumental;

  • Introdução a Análise de Regressão não Linear: Modelos Probit e Logit.

Referências:

  • WOOLDRIDGE, J.. Introductory Econometrics: a moderm approach. Thomson, 2003

  • HEISS, F. Using R for Introductory Econometrics. CreateSpace Independent Publishing Platform; Edição: 1 (5 de fevereiro de 2016).

  • HAYASHI, Fumio. Econometrics. Princeton University Press, 2000.

  • STOCK, James and WATSON, Mark. Introduction to Econometrics. Prentice Hall, 3rd edition.

  • MADDALA, J. S.. Introducion to Econometrics, John Wiley & Son, 3rd edition, 2001

7.4 - Econometria aplicada

Professor: Eduardo Ribeiro

Carga horária: 45 horas

Objetivo principal: Aprofundar o conhecimento de ferramentas econométricas, em sequencia ao curso de Econometria. Busca-se capacitar o aluno para desenvolver, com as ferramentas básicas, estudos de previsão, modelagem analítica e de análise de efeitos causais para análise de mercados, construção de cenários e relações macroeconômicas e para análise de investimentos.

Tópicos:

  • Modelos para modelagem e previsão de séries de tempo;

    • Modelos univariados para média e volatilidade: ARIMA, GARCH,

    • Avalição de modelos de previsão,

    • Não estacionariedade e cointegração: ECM e VECM.

  • Modelos para modelagem e identificação de efeitos causais;

    • Revisão em Identificação de efeitos causais em modelos de regressão,

    • Tipos de estimadores e modelos para dados longitudinais,

    • Modelos com controles para estimação de efeitos causais.

Referências:

  • ANGRIST, J. e PISCHKE, J-F. Mostly Harmless Econometrics. Princeton, 2008.

  • ALEXANDER, C. Modelos de Mercado. São Paulo: BM&F, 2005.

  • BUENO, R. L. Econometria de Séries de Tempo, 2ª Ed. Cengage Learning, 2011.

  • ENDERS, W. Applied Econometric Time Series, 3rd edition Wiley Series in Probability and Statistics. New York: Willey, 2010.

  • FERREIRA, P.G. (org) Análise de séries temporais em R : curso introdutório, Elsevier : FGV IBRE, 2018.[F – livro texto básico].

  • GERTLER, P. et al. Technical Companion - Impact Evaluation in Practice, Second Edition. WorldBank 2016.

  • VERBEEK, M. Modern Applied Econometrics, 3rd Ed.. Willey, 2010 [V - livro texto básico]

  • WOOLDRIDGE, J. Introdução à Econometria (trad 6a ed. Americana). Cengage 2018 [W - livro texto básico].