Treinar profissionais formados em Economia e detentores de boa base quantitativa (Matemática, Estatística e Econometria) para o uso profissional de ferramentas de Data Science. A extensão irá ajudar o aluno a adquirir o conjunto de habilidades necessárias para o uso de Ciência de Dados. Negócios e Computação, de maneira ampla, e Machine e Deep Learning, no campo de Ciência e Matemática, conforme diagrama abaixo.
Habilidades necessárias para a resolução de problemas usando Ciência de Dados.
O profissional que terminar o curso será capaz de implementar e liderar equipes de Ciência de Dados para modelos de Machine Learning e Inteligência Artificial com fins de executar e formular estratégias de negócios baseadas em dados. Como diferencial, a extensão prepara os alunos para avaliarem criticamente dados e modelos com base em sólidos fundamentos econômicos e analíticos. Ressalte-se que essas já são característicos das formações oferecidas pela FGV EPGE.
Ao longo da extensão os alunos entrarão em contato com profissionais e empreendedores destacados por meio da disciplina Estratégia de Negócios Baseadas em Dados. Além da transmissão de conhecimento, os alunos terão a oportunidade estreitar relações com estes profissionais.
Cada aluno deverá escolher projetos profissionais para se dedicarem deste o primeiro dia da extensão. Os projetos deverão ser aplicações de Ciência de Dados em Economia e Finanças. São esperadas aplicações em análise de crédito, marketing, análise de churn, segmentação de clientes etc.
Os projetos serão utilizados como avaliação nas disciplinas. Na disciplina de Estratégia de Negócios Baseadas em Dados os alunos farão apresentações baseadas na bibliografia sugeria pelos profissionais convidados.
Professores: Genaro Lins e Rafael Martins de Souza.
Carga horária: 45 horas.
Objetivo principal: Desenvolver nos alunos, por meio da interação com profissionais e empreendedores destacados e por meio de leituras e debates, as habilidades de liderança, comunicação, visão de negócio, empreendedorismo e inovação no desenvolvimento de soluções de problemas de negócio por meio de Ciência de Dados.
Tópicos:
Referências:
Professor: Felipe Buchbinder.
Carga horária: 45 horas.
Objetivo: Fornecer habilidades em programação para Data Science.
Tópicos:
Apresentação da cases de aplicação de Ciência de Dados em Economia;
Sintaxe e semântica da linguagem;
Estruturas de dados em Python;
Objetos: Variáveis e Funções (métodos);
Operadores e métodos relacionados, Indexação, slicing, listas, nesting de listas;
Tipos booleanos;
Indexação (no caso de dicionários); Conversão de tipos;
Navegação em listas com for, range() e enumerate();
Programação funcional: map, reduce, filter, zip, all, any, lambda e passagem de funções como parâmetros;
Álgebra Linear e manipulação de matrizes com Numpy;
Manipulação de bancos de dados com Pandas;
Visualização de dados com MatplotLib, Plotly e Altair.
Referência Básica:
Referência Complementares:
Consoli, S., Recupero, , D. R., Saisana, M. (Ed.), Data Science for Economics and Finance Methodologies and Applications, Springer, 2021.
Athey, S., The Impact of Machine Learning on Economics, The Economics of Artificial Intelligence: An Agend, University of Chicago Press, May 2019.
Gogas, P., Papadimitriou, T. Machine Learning in Economics and Finance. Comput Econ 57, 1–4, 2021. Disponível em https://doi.org/10.1007/s10614-021-10094-w.
Professor: Rafael Martins de Souza.
Carga horária: 45 horas.
Objetivo principal: Permitir que os alunos sejam proeficientes na implementação de modelos de Machine Learning.
Tópicos:
O Cenário do Aprendizado de Máquina e suas Aplicações em Economia;
Projeto de Aprendizado de Máquina Ponta a Ponta;
O MQO e O Gradiente Descendente;
Classificação;
Treinando Modelos;
Máquinas de Vetores de Suporte;
Árvores de Decisão;
Aprendizado Ensemble e Florestas Aleatórias;
Redução de Dimensionalidade;
Técnicas de Aprendizado Não Supervisionado.
Cases em Economia.
Referência Básica:
Referências Complementares:
Consoli, S., Recupero, D. R., Saisana, M. (Ed.), Data Science for Economics and Finance Methodologies and Applications, Springer, 2021.
Fasolo, A. M., Graminho, F. M., Bastos, S. B., Seeing the Forest for the Trees: Using hLDA Models to Evaluate Communication in Banco Central do Brasil, Working Paper Series 555, Banco Central do Brasil, August 2021.
Professor: Renato Rocha.
Carga horária: 45 horas.
Objetivo principal: Permitir que os alunos sejam proeficientes na implementação de modelos de Deep Learning e Inteligência Artifical.
Tópicos:
Introdução a Redes Neurais (RN) e Deep Learning (DL);
Bibliotecas do Python para RN e DN (Tensor Flow, Keras e Pytorch);
Redes Neurais Convolunionais;
Redes Neurais Recorrentes (RNN), Long Short Term Memory (LSTM) e Gated Recurrent Unit (GRU);
Processamento de Linguagem Natural (NLP) com RNN, LSTM, GRU;
Reinforcement Learning;
Generative Models;
Autoencoders;
GANs;
Deploying Models;
Graph Convolutional Neural Networks;
Deployment de modelos com Docker.
Referência em Redes Neurais:
Referências de Aplicações em Economia:
Consoli, S., Recupero, D. R., Saisana, M. (Ed.), Data Science for Economics and Finance Methodologies and Applications, Springer, 2021.
Henderson, J. Vernon, Adam Storeygard, and David N. Weil. 2012. “Measuring Economic Growth from Outer Space.” American Economic Review, 102 (2): 994-1028.DOI: 10.1257/aer.102.2.994, <Measuring Economic Growth from Outer Space - American Economic Association (aeaweb.org) >.
Donaldson, Dave, and Adam Storeygard. 2016. “The View from Above: Applications of Satellite Data in Economics.” Journal of Economic Perspectives, 30, 4. The View from Above: Applications of Satellite Data in Economics - American Economic Association.
Hoberg, G., Maksimovic, V., Redefining Financial Constraints: A Text-Based Analysis, The Review of Financial Studies, Volume 28, Issue 5, May 2015, Pages 1312–1352, https://doi.org/10.1093/rfs/hhu089.
Hansen, S., McMahon, M., Shocking language: Understanding the macroeconomic effects of central bank communication, Journal of International Economics, Volume 99, Supplement 1, 2016, Pages S114-S133, ISSN 0022-1996, https://doi.org/10.1016/j.jinteco.2015.12.008.
Hansen, S., Mcmahon, M., Prat, A., transparency And Deliberation Within The Fomc: A Computational Linguistics Approach, The Quarterly Journal of Economics (2018), 801–870.
Gentzkow, M., Kelly, B., Taddy, M., Journal of Economic Literature 2019, 57(3), 535–574,https://doi.org/10.1257/jel.20181020.
Algaba, A., Ardia, D., Bluteau, K., Borms, S. and Boudt, K. (2020), Econometrics Meets Sentiment: An Overview of Methodology and Applications, Journal of Economic Surveys, 34: 512-547, https://doi.org/10.1111/joes.12370.
Professor: Eduardo Hruscka.
Carga horária: 45 horas.
Objetivo principal: Fornecer ao aluno o conhecimento de Tecnologia da Informação necessário para que ele possa interagir em alto nível com profissionais da área e liderar equipes de Ciência de Dados.
Tópicos:
Modelo Entidade-Relacionamento.
Tipos de entidades, conjuntos de entidades e atributos-chaves.
Tipos de relacionamentos, papéis e restrições estruturais.
Diagrama Entidade-Relacionamento.
Modelo de Dados Relacional. Atributos-chaves de uma relação.
Esquemas de Bases de Dados Relacionais e Restrições de integridade.
Linguagens Formais de Consulta: Álgebra Relacional.
A linguagem SQL. Bancos de Dados NoSQL. Bancos de Dados RDF.
Gremilin e funções analíticas SQL.
Formatos de Dados. Modelagem Dimensional e Modelos de Dados.
Dados Estruturados e Dados não Estruturados.
Extração, Transformação e Carga (ETL).
Dados em Streaming. Projetos de Data Warehouse e Data Lake.
Sistemas e Melhores Práticas para Gestão de Big Data.
Plataformas de nuvem;
Ferramentas de big data (Spark, Airflow, Nifi);
Devops (Docker, CI/CD, etc) e MLops;
Gestão e Governança de dados e LGPD.
Referências:
Jukic, N., Vrbsky, S., Nestorov, S., & Sharma, A. (2021). Database Systems: An Introduction to Databases and Data Warehouses.
David Hay. Data Model Patterns: a metadata map. Morgan Kaufmann, 2006.
Kimball, R., & Ross, M. (2013). The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, 3rd ed.; I. John Wiley & Sons.
Sharma, B. (2018). Architecting Data Lakes. O’Reilly Media, Inc. http://www.oreilly.com/data/free/architecting-data-lakes.csp.
Bill Inmom. Data Lake Architecture: Designing the Data Lake and Avoiding the Garbage Dump.
Rêgo, B. L. (2013). Gestao e Governanca de Dados: Promovendo Dados Como Ativo de Valor nas Empresas, S. M. de Oliveira, ed.
Seidl, M., Scholz, M., Huemer, C., & Kappel, G. (2015). UML @ classroom : an introduction to object-oriented modeling. Springer International Publishing.