1 - Objetivo

Treinar profissionais formados em Economia e detentores de boa base quantitativa (Matemática, Estatística e Econometria) para o uso profissional de ferramentas de Data Science. A extensão irá ajudar o aluno a adquirir o conjunto de habilidades necessárias para o uso de Ciência de Dados. Negócios e Computação, de maneira ampla, e Machine e Deep Learning, no campo de Ciência e Matemática, conforme diagrama abaixo.

Habilidades necessárias para a resolução de problemas usando Ciência de Dados.

2 - Perfil do Profissional Treinado

O profissional que terminar o curso será capaz de implementar e liderar equipes de Ciência de Dados para modelos de Machine Learning e Inteligência Artificial com fins de executar e formular estratégias de negócios baseadas em dados. Como diferencial, a extensão prepara os alunos para avaliarem criticamente dados e modelos com base em sólidos fundamentos econômicos e analíticos. Ressalte-se que essas já são característicos das formações oferecidas pela FGV EPGE.

3 - Networking

Ao longo da extensão os alunos entrarão em contato com profissionais e empreendedores destacados por meio da disciplina Estratégia de Negócios Baseadas em Dados. Além da transmissão de conhecimento, os alunos terão a oportunidade estreitar relações com estes profissionais.

4 - Projetos

Cada aluno deverá escolher projetos profissionais para se dedicarem deste o primeiro dia da extensão. Os projetos deverão ser aplicações de Ciência de Dados em Economia e Finanças. São esperadas aplicações em análise de crédito, marketing, análise de churn, segmentação de clientes etc.

5 - Avaliações

Os projetos serão utilizados como avaliação nas disciplinas. Na disciplina de Estratégia de Negócios Baseadas em Dados os alunos farão apresentações baseadas na bibliografia sugeria pelos profissionais convidados.

6 - Disciplinas da Extensão

6.1 - Estratégia de Negócios Baseadas em Dados

Professores: Genaro Lins e Rafael Martins de Souza.

Carga horária: 45 horas.

Objetivo principal: Desenvolver nos alunos, por meio da interação com profissionais e empreendedores destacados e por meio de leituras e debates, as habilidades de liderança, comunicação, visão de negócio, empreendedorismo e inovação no desenvolvimento de soluções de problemas de negócio por meio de Ciência de Dados.

Tópicos:

  • Soft skills necessários para o sucesso na aplicação do Data Sciente em negócios: Liderança, Empreendedorismo, Comunicação, Visão de Negócios e Inovação.

Referências:

  • Apontadas pelos convidados durante os seminários.

6.2 - Introdução à Python para Ciência de Dados

Professor: Felipe Buchbinder.

Carga horária: 45 horas.

Objetivo: Fornecer habilidades em programação para Data Science.

Tópicos:

  • Apresentação da cases de aplicação de Ciência de Dados em Economia;

  • Sintaxe e semântica da linguagem;

  • Estruturas de dados em Python;

  • Objetos: Variáveis e Funções (métodos);

  • Operadores e métodos relacionados, Indexação, slicing, listas, nesting de listas;

  • Tipos booleanos;

  • Indexação (no caso de dicionários); Conversão de tipos;

  • Navegação em listas com for, range() e enumerate();

  • Programação funcional: map, reduce, filter, zip, all, any, lambda e passagem de funções como parâmetros;

  • Álgebra Linear e manipulação de matrizes com Numpy;

  • Manipulação de bancos de dados com Pandas;

  • Visualização de dados com MatplotLib, Plotly e Altair.

Referência Básica:

  • McKinney, W. Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython (English Edition), 2nd, O’Reilly Media, 2017.

Referência Complementares:

  • Consoli, S., Recupero, , D. R., Saisana, M. (Ed.), Data Science for Economics and Finance Methodologies and Applications, Springer, 2021.

  • Athey, S., The Impact of Machine Learning on Economics, The Economics of Artificial Intelligence: An Agend, University of Chicago Press, May 2019.

  • Gogas, P., Papadimitriou, T. Machine Learning in Economics and Finance. Comput Econ 57, 1–4, 2021. Disponível em https://doi.org/10.1007/s10614-021-10094-w.

6.3 - Aprendizado de Máquinas (Machine Learning) Aplicado à Economia

Professor: Rafael Martins de Souza.

Carga horária: 45 horas.

Objetivo principal: Permitir que os alunos sejam proeficientes na implementação de modelos de Machine Learning.

Tópicos:

  • O Cenário do Aprendizado de Máquina e suas Aplicações em Economia;

  • Projeto de Aprendizado de Máquina Ponta a Ponta;

  • O MQO e O Gradiente Descendente;

  • Classificação;

  • Treinando Modelos;

  • Máquinas de Vetores de Suporte;

  • Árvores de Decisão;

  • Aprendizado Ensemble e Florestas Aleatórias;

  • Redução de Dimensionalidade;

  • Técnicas de Aprendizado Não Supervisionado.

  • Cases em Economia.

Referência Básica:

  • Gueron, A., Hands-On Machine Learning with Scikit-Learn, Keras, and Tensorflow: Concepts, Tools, and Techniques to Build Intelligent Systems, O’Reilly Media; 2nd ed., October 2019.

Referências Complementares:

  • Consoli, S., Recupero, D. R., Saisana, M. (Ed.), Data Science for Economics and Finance Methodologies and Applications, Springer, 2021.

  • Fasolo, A. M., Graminho, F. M., Bastos, S. B., Seeing the Forest for the Trees: Using hLDA Models to Evaluate Communication in Banco Central do Brasil, Working Paper Series 555, Banco Central do Brasil, August 2021.

6.4 - Aprendizado Profundo (Deep Learning) e Inteligência Artificial (AI) Aplicados à Economia

Professor: Renato Rocha.

Carga horária: 45 horas.

Objetivo principal: Permitir que os alunos sejam proeficientes na implementação de modelos de Deep Learning e Inteligência Artifical.

Tópicos:

  • Introdução a Redes Neurais (RN) e Deep Learning (DL);

  • Bibliotecas do Python para RN e DN (Tensor Flow, Keras e Pytorch);

  • Redes Neurais Convolunionais;

  • Redes Neurais Recorrentes (RNN), Long Short Term Memory (LSTM) e Gated Recurrent Unit (GRU);

  • Processamento de Linguagem Natural (NLP) com RNN, LSTM, GRU;

  • Reinforcement Learning;

  • Generative Models;

  • Autoencoders;

  • GANs;

  • Deploying Models;

  • Graph Convolutional Neural Networks;

  • Deployment de modelos com Docker.

Referência em Redes Neurais:

  • Gueron, A., Hands-On Machine Learning with Scikit-Learn, Keras, and Tensorflow: Concepts, Tools, and Techniques to Build Intelligent Systems, O’Reilly Media; 2nd ed., October 2019.

Referências de Aplicações em Economia:

  • Consoli, S., Recupero, D. R., Saisana, M. (Ed.), Data Science for Economics and Finance Methodologies and Applications, Springer, 2021.

  • Henderson, J. Vernon, Adam Storeygard, and David N. Weil. 2012. “Measuring Economic Growth from Outer Space.” American Economic Review, 102 (2): 994-1028.DOI: 10.1257/aer.102.2.994, <Measuring Economic Growth from Outer Space - American Economic Association (aeaweb.org) >.

  • Donaldson, Dave, and Adam Storeygard. 2016. “The View from Above: Applications of Satellite Data in Economics.” Journal of Economic Perspectives, 30, 4. The View from Above: Applications of Satellite Data in Economics - American Economic Association.

  • Hoberg, G., Maksimovic, V., Redefining Financial Constraints: A Text-Based Analysis, The Review of Financial Studies, Volume 28, Issue 5, May 2015, Pages 1312–1352, https://doi.org/10.1093/rfs/hhu089.

  • Hansen, S., McMahon, M., Shocking language: Understanding the macroeconomic effects of central bank communication, Journal of International Economics, Volume 99, Supplement 1, 2016, Pages S114-S133, ISSN 0022-1996, https://doi.org/10.1016/j.jinteco.2015.12.008.

  • Hansen, S., Mcmahon, M., Prat, A., transparency And Deliberation Within The Fomc: A Computational Linguistics Approach, The Quarterly Journal of Economics (2018), 801–870.

  • Gentzkow, M., Kelly, B., Taddy, M., Journal of Economic Literature 2019, 57(3), 535–574,https://doi.org/10.1257/jel.20181020.

  • Algaba, A., Ardia, D., Bluteau, K., Borms, S. and Boudt, K. (2020), Econometrics Meets Sentiment: An Overview of Methodology and Applications, Journal of Economic Surveys, 34: 512-547, https://doi.org/10.1111/joes.12370.

6.5 - Computação para Data Science: Bancos de Dados e Tecnologias de TI

Professor: Eduardo Hruscka.

Carga horária: 45 horas.

Objetivo principal: Fornecer ao aluno o conhecimento de Tecnologia da Informação necessário para que ele possa interagir em alto nível com profissionais da área e liderar equipes de Ciência de Dados.

Tópicos:

  • Modelo Entidade-Relacionamento.

  • Tipos de entidades, conjuntos de entidades e atributos-chaves.

  • Tipos de relacionamentos, papéis e restrições estruturais.

  • Diagrama Entidade-Relacionamento.

  • Modelo de Dados Relacional. Atributos-chaves de uma relação.

  • Esquemas de Bases de Dados Relacionais e Restrições de integridade.

  • Linguagens Formais de Consulta: Álgebra Relacional.

  • A linguagem SQL. Bancos de Dados NoSQL. Bancos de Dados RDF.

  • Gremilin e funções analíticas SQL.

  • Formatos de Dados. Modelagem Dimensional e Modelos de Dados.

  • Dados Estruturados e Dados não Estruturados.

  • Extração, Transformação e Carga (ETL).

  • Dados em Streaming. Projetos de Data Warehouse e Data Lake.

  • Sistemas e Melhores Práticas para Gestão de Big Data.

  • Plataformas de nuvem;

  • Ferramentas de big data (Spark, Airflow, Nifi);

  • Devops (Docker, CI/CD, etc) e MLops;

  • Gestão e Governança de dados e LGPD.

Referências:

  • Jukic, N., Vrbsky, S., Nestorov, S., & Sharma, A. (2021). Database Systems: An Introduction to Databases and Data Warehouses.

  • David Hay. Data Model Patterns: a metadata map. Morgan Kaufmann, 2006.

  • Kimball, R., & Ross, M. (2013). The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, 3rd ed.; I. John Wiley & Sons.

  • Sharma, B. (2018). Architecting Data Lakes. O’Reilly Media, Inc. http://www.oreilly.com/data/free/architecting-data-lakes.csp.

  • Bill Inmom. Data Lake Architecture: Designing the Data Lake and Avoiding the Garbage Dump.

  • Rêgo, B. L. (2013). Gestao e Governanca de Dados: Promovendo Dados Como Ativo de Valor nas Empresas, S. M. de Oliveira, ed. 

  • Seidl, M., Scholz, M., Huemer, C., & Kappel, G. (2015). UML @ classroom : an introduction to object-oriented modeling. Springer International Publishing.