Treinar profissionais formados em Economia e detentores de boa base quantitativa (Matemática, Estatística e Econometria) para o uso profissional de ferramentas de Data Science. A extensão irá ajudar o aluno a adquirir o conjunto de habilidades necessárias para o uso de Ciência de Dados. Negócios e Computação, de maneira ampla, e Machine e Deep Learning, no campo de Ciência e Matemática, conforme diagrama abaixo.
Habilidades necessárias para a resolução de problemas usando Ciência de Dados.
O profissional que terminar o curso será capaz de implementar e liderar equipes de Ciência de Dados para modelos de Machine Learning e Inteligência Artificial com fins de executar e formular estratégias de negócios baseadas em dados. Como diferencial, a extensão prepara os alunos para avaliarem criticamente dados e modelos com base em sólidos fundamentos econômicos e analíticos. Ressalte-se que essas já são característicos das formações oferecidas pela FGV EPGE.
Ao longo da extensão os alunos entrarão em contato com profissionais e empreendedores destacados por meio da disciplina Estratégia de Negócios Baseadas em Dados. Além da transmissão de conhecimento, os alunos terão a oportunidade estreitar relações com estes profissionais.
Cada aluno deverá escolher projetos profissionais para se dedicarem deste o primeiro dia da extensão. Os projetos deverão ser aplicações de Ciência de Dados em Economia e Finanças. São esperadas aplicações em análise de crédito, marketing, análise de churn, segmentação de clientes etc.
Os projetos serão utilizados como avaliação nas disciplinas. Na disciplina de Estratégia de Negócios Baseadas em Dados os alunos farão apresentações baseadas na bibliografia sugeria pelos profissionais convidados.
Professores: Genaro Lins e Rafael Martins de Souza
Carga horária: 45 horas
Objetivo principal: Desenvolver nos alunos, por meio da interação com profissionais e empreendedores destacados e por meio de leituras e debates, as habilidades de liderança, comunicação, visão de negócio, empreendedorismo e inovação no desenvolvimento de soluções de problemas de negócio por meio de Ciência de Dados.
Tópicos:
Referências:
Professor: Rafael Martins de Souza
Carga horária: 45 horas
Objetivo: Fornecer habilidades em programação para Data Science.
Tópicos:
Apresentação da cases de aplicação de Ciência de Dados em Economia;
Sintaxe e semântica da linguagem;
Estruturas de dados em Python;
Objetos: Variáveis e Funções (métodos);
Operadores e métodos relacionados, Indexação, slicing, listas, nesting de listas;
Tipos booleanos;
Indexação (no caso de dicionários); Conversão de tipos;
Navegação em listas com for, range() e enumerate();
Programação funcional: map, reduce, filter, zip, all, any, lambda e passagem de funções como parâmetros;
Álgebra Linear e manipulação de matrizes com Numpy;
Manipulação de bancos de dados com Pandas;
Visualização de dados com MatplotLib, Plotly e Altair.
Referência Básica:
Referência Complementares:
Consoli, S., Recupero, , D. R., Saisana, M. (Ed.), Data Science for Economics and Finance Methodologies and Applications, Springer, 2021.
Athey, S., The Impact of Machine Learning on Economics, The Economics of Artificial Intelligence: An Agend, University of Chicago Press, May 2019.
Gogas, P., Papadimitriou, T. Machine Learning in Economics and Finance. Comput Econ 57, 1–4, 2021. Disponível em https://doi.org/10.1007/s10614-021-10094-w.
Professor: Rafael Martins de Souza
Carga horária: 45 horas
Objetivo principal: Permitir que os alunos sejam proeficientes na implementação de modelos de Machine Learning.
Tópicos:
O Cenário do Aprendizado de Máquina e suas Aplicações em Economia;
Projeto de Aprendizado de Máquina Ponta a Ponta;
O MQO e O Gradiente Descendente;
Classificação;
Treinando Modelos;
Máquinas de Vetores de Suporte;
Árvores de Decisão;
Aprendizado Ensemble e Florestas Aleatórias;
Redução de Dimensionalidade;
Técnicas de Aprendizado Não Supervisionado.
Cases em Economia.
Referência Básica:
Referências Complementares:
Consoli, S., Recupero, D. R., Saisana, M. (Ed.), Data Science for Economics and Finance Methodologies and Applications, Springer, 2021.
Fasolo, A. M., Graminho, F. M., Bastos, S. B., Seeing the Forest for the Trees: Using hLDA Models to Evaluate Communication in Banco Central do Brasil, Working Paper Series 555, Banco Central do Brasil, August 2021.
Professor: Renato Rocha
Carga horária: 45 horas
Objetivo principal: Permitir que os alunos sejam proeficientes na implementação de modelos de Deep Learning e Inteligência Artifical.
Tópicos:
Introdução a Redes Neurais (RN) e Deep Learning (DL);
Bibliotecas do Python para RN e DN (Tensor Flow, Keras e Pytorch);
Redes Neurais Convolunionais;
Redes Neurais Recorrentes (RNN), Long Short Term Memory (LSTM) e (Gated Recurrent Unit) (GRU);
Processamento de Linguagem Natural (NLP) com RNN, LSTM, GRU;
Séries de Temporais com Redes Neurais;
Reinforcement Learning;
Generative Models;
Autoencoders;
GANs;
Deploying Models;
Graph Convolutional Neural Networks;
Deployment de modelos com Docker.
Referência em Redes Neurais:
Referências de Aplicações em Economia:
Consoli, S., Recupero, D. R., Saisana, M. (Ed.), Data Science for Economics and Finance Methodologies and Applications, Springer, 2021.
Henderson, J. Vernon, Adam Storeygard, and David N. Weil. 2012. “Measuring Economic Growth from Outer Space.” American Economic Review, 102 (2): 994-1028.DOI: 10.1257/aer.102.2.994, <Measuring Economic Growth from Outer Space - American Economic Association (aeaweb.org) >.
Donaldson, Dave, and Adam Storeygard. 2016. “The View from Above: Applications of Satellite Data in Economics.” Journal of Economic Perspectives, 30, 4. The View from Above: Applications of Satellite Data in Economics - American Economic Association.
Hoberg, G., Maksimovic, V., Redefining Financial Constraints: A Text-Based Analysis, The Review of Financial Studies, Volume 28, Issue 5, May 2015, Pages 1312–1352, https://doi.org/10.1093/rfs/hhu089.
Hansen, S., McMahon, M., Shocking language: Understanding the macroeconomic effects of central bank communication, Journal of International Economics, Volume 99, Supplement 1, 2016, Pages S114-S133, ISSN 0022-1996, https://doi.org/10.1016/j.jinteco.2015.12.008.
Hansen, S., Mcmahon, M., Prat, A., transparency And Deliberation Within The Fomc: A Computational Linguistics Approach, The Quarterly Journal of Economics (2018), 801–870.
Gentzkow, M., Kelly, B., Taddy, M., Journal of Economic Literature 2019, 57(3), 535–574,https://doi.org/10.1257/jel.20181020.
Algaba, A., Ardia, D., Bluteau, K., Borms, S. and Boudt, K. (2020), Econometrics Meets Sentiment: An Overview of Methodology and Applications, Journal of Economic Surveys, 34: 512-547, https://doi.org/10.1111/joes.12370.
Professor: Júlio César Chaves
Carga horária: 45 horas
Objetivo principal: Fornecer ao aluno o conhecimento de Tecnologia da Informação necessário para que ele possa interagir em alto nível com profissionais da área e liderar equipes de Ciência de Dados.
Tópicos:
Modelo Entidade-Relacionamento.
Tipos de entidades, conjuntos de entidades e atributos-chaves.
Tipos de relacionamentos, papéis e restrições estruturais.
Diagrama Entidade-Relacionamento.
Modelo de Dados Relacional. Atributos-chaves de uma relação.
Esquemas de Bases de Dados Relacionais e Restrições de integridade.
Linguagens Formais de Consulta: Álgebra Relacional.
A linguagem SQL. Bancos de Dados NoSQL. Bancos de Dados RDF.
Gremilin e funções analíticas SQL.
Formatos de Dados. Modelagem Dimensional e Modelos de Dados.
Dados Estruturados e Dados não Estruturados.
Extração, Transformação e Carga (ETL e ELT).
Dados em Streaming. Projetos de Data Warehouse e Data Lake.
Sistemas e Melhores Práticas para Gestão de Big Data.
Plataformas de cloud;
Ferramentas de big data (Spark, Airflow, Nifi);
Devops (Docker, CI/CD, etc) e MLops;
Gestão e Governança de dados e LGPD.
Referências:
Jukic, N., Vrbsky, S., Nestorov, S., & Sharma, A. (2021). Database Systems: An Introduction to Databases and Data Warehouses.
David Hay. Data Model Patterns: a metadata map. Morgan Kaufmann, 2006.
Kimball, R., & Ross, M. (2013). The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, 3rd ed.; I. John Wiley & Sons.
Sharma, B. (2018). Architecting Data Lakes. O’Reilly Media, Inc. http://www.oreilly.com/data/free/architecting-data-lakes.csp.
Bill Inmom. Data Lake Architecture: Designing the Data Lake and Avoiding the Garbage Dump.
Rêgo, B. L. (2013). Gestao e Governanca de Dados: Promovendo Dados Como Ativo de Valor nas Empresas, S. M. de Oliveira, ed.
Seidl, M., Scholz, M., Huemer, C., & Kappel, G. (2015). UML @ classroom : an introduction to object-oriented modeling. Springer International Publishing.
Professor: Rafael Martins de Souza
Carga horária: 45 horas
Objetivo principal: Permitir que os alunos do Mestrado Profissional em Economia e Finanças da FGV EPGE sejam capazes de utilizar o R em suas atividades profissionais relacionadas à Ciência de Dados, Econometria e Estatística.
Tópicos:
Apresentação do R e dos ambientes de programação em R;
Introdução à Programação em R;
Variáveis em R;
Estrutura de Dados em R;
Estruturas de Controle;
Funções;
Captura de Dados Nacionais;
Captura de Dados Internacionais;
Visualização de Dados;
Analise Exploratória de Dados.
Referências:
Professor: Edudardo Campos
Carga horária: 45 horas
Objetivo principal: Apresentar e consolidar os conceitos mais importantes da teoria estatística, com ênfase nas aplicações em economia e finanças.
Tópicos:
Estatística Descritiva;
Probabilidade e Variáveis Aleatórias;
Distribuições de Probabilidade;
Estimação;
Intervalos de Confiança;
Testes de Hipóteses.
Referências:
Notas de Aula do Professor Eduardo Campos, disponibilizadas na página wiki.
KELLER. Statistics for Management and Economics. 9th ed. Thomson, 2011.
LARSON. Introduction to Probability and Statistical Inference. 3rd ed., 1982.
Professor: Pedro Engel
Carga horária: 60 horas
Objetivo principal: Capacitar o aluno para o desenvolvimento de trabalhos empíricos nas diferentes áreas de economia através do uso de software econométrico R e de técnicas sofisticadas de estatística e econometria.
Tópicos:
Análise de Regressão;
O método de mínimos quadrados;
Inferência estatística no modelo de regressão linear;
Regressão Múltipla;
Interpretação dos coeficientes de regressão;
Análise de variância e teste de hipótese;
Variáveis omitidas e variáveis irrelevantes;
O Coeficiente R2;
A estatística de Wald;
Violações das suposições do modelo de regressão linear;
Heterocedasticidade;
Multicolinearidade;
Variáveis Dummy;
Método de estimação: o método de variável instrumental;
Introdução a Análise de Regressão não Linear: Modelos Probit e Logit.
Referências:
WOOLDRIDGE, J.. Introductory Econometrics: a moderm approach. Thomson, 2003
HEISS, F. Using R for Introductory Econometrics. CreateSpace Independent Publishing Platform; Edição: 1 (5 de fevereiro de 2016).
HAYASHI, Fumio. Econometrics. Princeton University Press, 2000.
STOCK, James and WATSON, Mark. Introduction to Econometrics. Prentice Hall, 3rd edition.
MADDALA, J. S.. Introducion to Econometrics, John Wiley & Son, 3rd edition, 2001
Professor: Eduardo Ribeiro
Carga horária: 45 horas
Objetivo principal: Aprofundar o conhecimento de ferramentas econométricas, em sequencia ao curso de Econometria. Busca-se capacitar o aluno para desenvolver, com as ferramentas básicas, estudos de previsão, modelagem analítica e de análise de efeitos causais para análise de mercados, construção de cenários e relações macroeconômicas e para análise de investimentos.
Tópicos:
Modelos para modelagem e previsão de séries de tempo;
Modelos univariados para média e volatilidade: ARIMA, GARCH,
Avalição de modelos de previsão,
Não estacionariedade e cointegração: ECM e VECM.
Modelos para modelagem e identificação de efeitos causais;
Revisão em Identificação de efeitos causais em modelos de regressão,
Tipos de estimadores e modelos para dados longitudinais,
Modelos com controles para estimação de efeitos causais.
Referências:
ANGRIST, J. e PISCHKE, J-F. Mostly Harmless Econometrics. Princeton, 2008.
ALEXANDER, C. Modelos de Mercado. São Paulo: BM&F, 2005.
BUENO, R. L. Econometria de Séries de Tempo, 2ª Ed. Cengage Learning, 2011.
ENDERS, W. Applied Econometric Time Series, 3rd edition Wiley Series in Probability and Statistics. New York: Willey, 2010.
FERREIRA, P.G. (org) Análise de séries temporais em R : curso introdutório, Elsevier : FGV IBRE, 2018.[F – livro texto básico].
GERTLER, P. et al. Technical Companion - Impact Evaluation in Practice, Second Edition. WorldBank 2016.
VERBEEK, M. Modern Applied Econometrics, 3rd Ed.. Willey, 2010 [V - livro texto básico]
WOOLDRIDGE, J. Introdução à Econometria (trad 6a ed. Americana). Cengage 2018 [W - livro texto básico].