A Model Thinking Br oferece soluções em Advanced Analytics utilizando suporte estatístico e computacional, machine learning e métodos de otimização. Buscamos atender às demandas de nossos clientes de maneira ótima e fazendo com que as ferramentas desenvolvidas façam parte do cotidiano da empresa.
Fazem parte do nosso portfólio: análises de Churn, Data Science Lab Management, Human Resources Analytics, previsões de curto, médio e longo prazos, validação de modelos/algoritmos computacionais, estudo de probabilidades/scores associadas a eventos, auxílio na contratação de cientistas de dados, desenvolvimento de indicadores etc.
Atendemos empresas de pequeno, médio e grande porte fornecendo, além das informações demandadas, plataformas capazes de produzir tais estudos.
Somos pragmáticos e abertos a novas soluções. Começamos por definir as questões certas, para então examiná-las com rigor analítico, como base para criar as respectivas soluções.
Nossa equipe, formada por mestres e doutores, possui forte vínculo com a academia, buscando sempre trazer conhecimentos de fronteira para nossos clientes.
Entre em contato conosco: contato@modelthinkingbr.com
(*) Para aproveitar melhor a plataforma, clique para abrir a notícia em uma nova aba.
Fonte: Techspot
Briefing: “What I’ve seen change in the industry, starting about eight years ago, is firms got more serious about using the scientific method and removing chunks of guesswork within companies,” Bajari said. “You’re basically trying to clean up waste.”
Fonte: Valor Econômico
Briefing: “Todos nós estamos vivendo em um mundo moldado e definido pela TI, mas muitos de nós temos um modelo mental da tecnologia análogo a crer que as doenças são causadas por espíritos malignos”, diz Malone. “Você pode dar às pessoas uma compreensão suficiente para que elas saibam como fazer as perguntas certas.”
Fonte: Freek Vermeulen and Niro Sivanathan (LBS)
Briefing: “Regret in business comes from thinking, ‘If only we’d taken a different path’. Getting managers to anticipate this feeling is a good way to prevent them from sticking rigidly to a failing strategy”
Fonte: Philipp M. Diesinger
Briefing: É um artigo de 2016 mas retrata bem as características necessárias para se montar um bom time de data science.
Fonte: Alexander Thamm
Briefing:“Big Data, Small Data, Little Data, Fast Data, and Smart Data are all “Just Data.” The critical success factors for the use of data do not depend on its quantity, structure, or speed – it’s about using data to create true added value!”
Fonte: analyticbridge
Briefing: “With a data analysis plan, you know what you’re going to do when you actually sit down to do the analysis of the data you’ve gathered. It’s a vitally important thing for you to have, as it will guide how you’re going to collect your data. After all, it’s very difficult to add in new variables afterward.”
Fonte: James, Witten, Hastie and Tibshirani
Briefing: “This book presents some of the most important modeling and prediction techniques, along with relevant applications.”
Fonte: JT Kostman
Briefing: “Data science is not about writing code. It’s about the application of concepts.” “Continually remind yourself that the unprecedented power of mathematics comes from just three things: Abstraction, Precision, and Compactness”.
Fonte: Revolutions
Briefing: “Central to the process is automating the report with Rmarkdown, a system for programmatically laying out a document while encapsulating all of the R code for data preparation, analysis, tabulation and charting into a collaborative document.”
Fonte: BCB
Briefing: Muito interessante esse discurso de 40 minutos em que Paulo Guedes expõe pontos importantes para o futuro do país e a necessidade de o governo se tornar “digital”.
Fonte: HBR
Briefing: “But the goal of data science is not to execute. Rather, the goal is to learn and develop profound new business capabilities” …. “With data science, you learn as you go, not before you go.”
Fonte: Manning publications
Briefing: A eterna discussão Python vs R. Conclusão?! Seja agnóstico com relação a linguagem utilizada para data science
Fonte: Vincent Granville
Briefing: essa é uma série preparada por Vincent Granville sobre tópicos relacionados a data science. Nesse artigo ele fala sobre artigos relacionados a análise de séries temporais
Fonte: Bain & Company
Briefing: Webinar interessante da Bain & Company
Fonte: Data Science Central
Briefing: Comparação interessante entre as bibliotecas do Python, R e Scala
Fonte: HBR
Briefing: Esse artigo retrata as habilidades de um economista e explique porque as empresas de tecnologia estão à procura dos mesmos
Fonte: The Economist
Briefing: “Startups, too, are hoping to jump on the AI bandwagon. Many offer services like helping clean up and label data, and take on specific tasks that large tech firms are not yet offering, like helping firms recruit, scan job descriptions and improve customer service. For large companies it makes sense to outsource most of their AI work, except where it directly affects their strategic edge”
Fonte: Manning publications
Briefing: “Practical Data Science with R, Second Edition is the essential guide to applying R to solve everyday business situations. This fully updated edition covers essential new topics like model explanation, modeling techniques like boosting and regularized regression, and more”
Fonte: Andrew NG
Briefing: draft do livro do Andrew NG - um dos papas do ML. Vale a pena se cadastrar e fazer o download.
“AI is transforming numerous industries. Machine Learning Yearning, a free book that Dr. Andrew Ng is currently writing, teaches you how to structure Machine Learning projects.
This book is focused not on teaching you ML algorithms, but on how to make ML algorithms work. After reading Machine Learning Yearning, you will be able to:
Prioritize the most promising directions for an AI project Diagnose errors in a machine learning system Build ML in complex settings, such as mismatched training/ test sets Set up an ML project to compare to and/or surpass human- level performance Know when and how to apply end-to-end learning, transfer learning, and multi-task learning"
Fonte: Coursera
Briefing: esse curso gratuito ministrado pelo Andrew Ng vai valer a pena. O melhor curso de ML do Coursera é o dele e certamente virá coisa boa!!
AI is not only for engineers. This non-technical course will help you understand technologies like machine learning and deep learning and spot opportunities to apply AI to problems in your own organization. You will see examples of what today’s AI can - and cannot - do. Finally, you will understand how AI is impacting society and how to navigate through this technological change
Fonte: Data Science Central
Briefing: Lift Charts & Gain Charts; ROC Curve; Gini coefficient; Cross Validation; Confusion Matrix; Root Mean Squared Error
Fonte: Peter Laurinec
Briefing: O autor usa arvore de decisão para a previsão de séries temporais do consumo de energia elétrica. Mas, como arvore de decisão não computa os coeficientes de regressão como uma regressão linear fica impossível modelar a tendência. Para corrigir essa limitação o autor propõe um modelo híbrido.
Fonte: IDGNOW
Briefing: Com a migração, os desenvolvedores estão com mais liberdade e maior escala, sem sacrificar a qualidade do serviço. “Qualidade de serviço é algo que medimos diligentemente e não houve degradação”, disse Van Alteren. “Os benefícios incluem nosso canal de entrega de eventos, que carrega os pagamentos de royalties para detentores de direitos. Quando mudamos para a nuvem, o pipeline transportava no pico de 800 mil eventos por segundo e agora carregam três milhões por segundo
Fonte: Towards Data Science
Briefing: Learning a new language for data science takes time, but it helps to have a plan for how you’ll spend your time ramping up. My overall recommendation is to dive right in and get coding on applied problems with real data. You’ll find out where you have gaps and can use that to guide your learning process
Fonte: Sanjiv Ranjan Das
Briefing: livro escrito por Sanjiv Ranjan Das. Ótimo dicionário e guia sobre a área de big data e data science
Fonte: Comprehension 360
Briefing: “Technology allows all of us to aspire but only those who invest the time and effort, who build the discipline and education, will be able to rise to the level of providing meaningful and predictive analytics. Everyone else is just dreaming”
Fonte: Forbes
Briefing: “Worldwide Big Data market revenues for software and services are projected to increase from 42Bi in 2018 to 103Bi in 2027, attaining a Compound Annual Growth Rate (CAGR) of 10.48% according to Wikibon.
According to an Accenture study, 79% of enterprise executives agree that companies that do not embrace Big Data will lose their competitive position and could face extinction. Even more, 83%, have pursued Big Data projects to seize a competitive edge.“”
Fonte: London Business School Review
Briefing: “How is your organisation adapting to the digital revolution? New digital technologies – and in particular the rapid rise of artificial intelligence – are forcing you to rethink fundamental aspects of your business model and your way of working.”
Fonte: Valor
Briefing: “segundo um levantamento global da consultoria PwC. Menos da metade dos executivos acham que os gestores de RH têm um entendimento profundo das atuais mudanças tecnológicas do mercado.”
Fonte: Havard Business Review
Briefing: “In an excellent strategy, more data projects have worked out, and they were surprisingly cost-effective to develop. Further, the process of building the first few projects inspires new project ideas. In an excellent strategy, the projects will include automation and efficiency and performance improvements, but they will also include projects and ideas for new revenue generation and entirely new businesses driven by your unique data assets.
The best strategies are strong in directional conviction, but flexible in the details. You want to know where you want to end up, but not necessarily pre-define each step you need to take to get there."
Fonte: Valor
Briefing: “Há mais de meio milhão de motoristas ativos no Uber no Brasil e nenhum deles tem supervisores humanos. São todos gerenciados por algoritmos. De uma maneira simplificada, os algoritmos podem ser vistos como regras do negócio codificadas em software.”
Fonte: Época negócios
Briefing: “Espaço tem como objetivo fomentar pesquisa e promover intercâmbio de informação entre iniciativa privada e universidade”
Fonte: Valor
Briefing: “… para que a tecnologia faça uma contribuição efetiva e sustentada ao desenvolvimento, ela tem não apenas de oferecer produtos melhores e mais baratos; tem também de levar ao acesso a ocupações mais bem-remuneradas. Em outras palavras, ela precisa ajudar pessoas pobres tanto em seu papel de produtoras quanto no de consumidoras…”
Fonte: Folha de São Paulo
Briefing: " … A JLT chegou a essa conclusão após desenvolver um programa chamado Meu BI, uma plataforma que cruza diferentes bancos de dados e detecta padrões de saúde das pessoas com um sistema de inteligência artificial. Qualquer procedimento de saúde que um funcionário faz com o plano de saúde da empresa cai na base de dados da plataforma …"
Fonte: Journal of Business Cycle Research
Briefing: “We propose a measure of economic uncertainty, the Brazilian Economic Uncertainty Indicator, based on the news as well as business forecasts. The index expands the variety of newspapers handled by Baker et al. (Q J Econ 131(4):1593–1636, 2016) for Brazil. Our indicator captures Brazilian recent events such as the corruption scandals, the fiscal and economic crisis, the 2016 impeachment, the 2008 financial crisis and the 2002 presidential elections as moments of high uncertainty. An econometric study using a Bayesian Vector Autoregressive approach was carried out and revealed that uncertainty shocks cause an economic downturn in subsequent periods, as emphasized in the relevant literature.”
Fonte: The Wall Street Journal
Briefing: “Restaurants, with more information than ever about their customers, tailor their menus and service to individuals.”
“We’re trying to understand what’s underneath food choices: Do you like beets because of their sweetness or crunchiness?” says Sweetgreen co-founder and Chief Executive Jonathan Neman. “We want to crack the code around food decisions.”
Fonte: London Business School Review
Briefing: “Few CEOs realise that AI can help them achieve their business objectives and shape P&L. They know how to use organisation redesign, cost-cutting, mergers and acquisitions, business and product launches and geographic expansion, but fail to see that AI is a powerful tool to be added to their toolkit.”
Perguntas que precisam ser respondidas por quem quer usar técnicas de IA:
“What is the potential size of the prize?”
“At what stage is the market evolution?”
“What have early adopters achieved?”
“Which pitfalls to avoid?”"
Fonte: R bloggers
Briefing: Essa é uma das melhores entrevistas que li/ouvi esse ano. Nela, Allen B. Downey, autor de vários livros (http://greenteapress.com/thinkapjava/index.html) e famoso na área, fala sobre como lidar com a incerteza em data science. Tópico interessante e bastante útil para quem trabalha diariamente com dados e probabilidade. Boa leitura e aproveitem a semana!
Alguns trechos da entrevista: “…I think there are a lot of experiments going, so I think we will get better at communicating these ideas, and I think the audience is also learning, so different visualizations that wouldn’t have worked very well a few years ago, now people are I think just better at interpreting data, interpreting visualizations, because it’s become part of the media in a way that it wasn’t. If you’d look back not that long ago…”
“Certainly, one of the problems is that we’re very bad at small risks, small probabilities. There’s some evidence that we can do a little bit better if we express things in terms of natural frequencies, so if I tell you that something has a .01% probability, you might have a really hard time making sense of that, but if I tell you that it’s something like one person out of 10,000, then you might have a way to picture that. You could say, “Well, okay. At a baseball game, there might be 30,000 people, so there could be three people here right now how have such-and-such a condition.So, what are the most important misconceptions regarding uncertainty that you think we need to correct, those data-oriented educators?”
“Right. Well, we talked about probabilistic predictions. I think that’s a big one. I think the other big one that I think about is the shapes of distributions, that when you try to summarize a distribution, if I just tell you the mean, then people generally assume that it’s something like a bell-shaped curve, and we have some intuition for what that’s like, that if I tell you that the average human being is about 165 centimeters tall, or I think it’s more than that, but anyway, you get a sense of, “Okay. So, probably there are some people who are over 200, and probably there are some people who are less than 60, but there probably isn’t anybody who is a kilometer tall.” We have a sense of that distribution.”
“But then you get things like the Pareto distribution, and this is one of the examples I use in my book, is what I call Pareto World, which is same as our world, because the average height is about the same, but the distribution is shaped like a Pareto distribution, which is one of these crazy long-tailed distributions, and in Pareto World, the average height is between one and two meters, but the vast majority of people are only a centimeter tall, and if you have seven billion people in Pareto World, the tallest one is probably a hundred kilometers tall.”}
Fonte: Computerworld
Briefing: “Os gastos globais com sistemas de inteligência artificial (AI) e cognitivos manterão a trajetória de crescimento exponencial, segundo previsões da IDC.” … “fornecedores que buscam tirar proveito da AI deep learning e machine learning precisam se movimentar rapidamente para ganhar espaço nesse mercado emergente.”
Fonte: R/medicine conference 2018
Briefing: “The goal of the R/Medicine conference is to promote the use of the R programming environment and the R ecosystem in medical research and clinical practice. R, the open source language for statistical computing and data visualization, has also become an effective tool for enabling reproducible research and the communication of scientific knowledge. In addition to showcasing novel tools, algorithms and methods for analyzing medical and clinical data.”
Fonte: Data Science Central
Briefing: Essa é uma longa discussão e um tema muito debatido nas empresas que estão começando a montar equipes de data science. Existe ou não a figura do cientista de dados júnior? Esse artigo ajuda a esclarecer um pouco essa discussão e pontua algumas responsabilidades de um cientista de dados sênior.
Fonte: MTBr
Briefing: Conforme podem observar abaixo, ontem divulgamos as nossas previsões da produção industrial e hoje, confirmando nossas estimativas, houve uma recuperação com relação a queda abrupta sofrida no mês passado e a variação ficou em 13,1% (nossa previsão foi 12,5%). Esse post mostra como é possível prever o futuro e, mais ainda, a importância dos modelos de machine learning nessa tarefa. Estamos vivendo uma revolução propiciada por esses modelos que foi vista pela última vez na década de 1970 com os modelos SARIMA. Aproveitem a semana!!
Industrial production app - https://goo.gl/7yP7pb
Fonte: MTBr
Briefing: Amanha será divulgada a produção industrial. Nós, uma empresa que trabalha todo o tempo com previsões, não poderíamos deixar de enviar as nossas previsões sobre o resultados da PIM-PF. Abaixo o link para o software que desenvolvemos que mostra não só os resultados das previsões, mas também, erros de previsão e os modelos que já desenvolvemos até o momento. MoM - 12.5% (estamos prevendo uma recuperação com relação a queda abrupta sofrida no mês passado)
Industrial production app - https://goo.gl/7yP7pb
Fonte: IMPA
Briefing: “Na primeira metade do século 18, os cidadãos de Königsberg, chamada desde 1946 de Kaliningrad (Rússia), estavam muito orgulhosos das sete pontes que atravessavam a cidade. Com as lindas vistas do rio, eles gostavam de cruzar as pontes durante as caminhadas. Naturalmente, uma questão surgiu: seria possível escolher um caminho que permitiria atravessar cada ponte apenas uma vez?
Vamos aos detalhes: Königsberg é cortada pelo Rio Prególia, onde há duas grandes ilhas. De cada uma das quatro partes deste complexo sai um número ímpar de pontes, como mostra a figura. Será que tem jeito? O problema chamou a atenção do matemático e físico suíço Leonard Euler. A solução negativa veio em 1736 e originou a teoria dos grafos. O raciocínio de Euler foi o seguinte: transformar os caminhos em linhas e suas intersecções em pontos. A partir disso, ele percebeu que só seria possível atravessar o caminho inteiro passando uma única vez em cada ponte se houvesse exatamente zero ou dois pontos de onde saísse um número ímpar de caminhos. A razão é que, de cada ponto, deve haver um número par de caminhos, pois será preciso um caminho para “entrar” e outro para “sair”. Os dois pontos com caminhos ímpares referem-se ao início e ao final do percurso, pois não precisam de um para entrar e um para sair, respectivamente. Se não houver pontos com número ímpar de caminhos, pode-se (e deve-se) iniciar e terminar o trajeto no mesmo ponto, podendo esse ser qualquer ponto do grafo. Isso não é possível quando temos dois pontos com números ímpares de caminhos, sendo obrigatoriamente um o início e outro o fim."
vídeo explicativo (Numberphile) - https://goo.gl/RD2FQW
Fonte: dataviz
Briefing: Power BI is a collection of software services, apps, and connectors that work together to turn your unrelated sources of data into coherent, visually immersive, and interactive insights. Whether your data is a simple Excel spreadsheet, or a collection of cloud-based and on-premises hybrid data warehouses, Power BI lets you easily connect to your data sources, visualize (or discover) what’s important, and share that with anyone or everyone you want.
Fonte: FGV|IBRE
Briefing: Esse post é dedicado a apresentação do indicador de incerteza da economia brasileira, uma importante variável para o acompanhamento macroeconômico. Apenas para comentar uma ocorrência importante envolvendo tal variável, na reunião do COPOM de maio de 2017, logo após a divulgação dos áudios dos irmãos Batista, a justificativa para uma queda menor na queda de juros foi a incerteza econômica e a palavra incerteza foi citada 17 vezes na ata de 5 páginas. Abaixo + informações sobre o indicador:
Incerteza da economia é alta pelo quinto mês consecutivo, mostra FGV
Ata do COPOM (maio 2017) - https://goo.gl/5dNsyf
Workshop BACEN - apresentação
Incerteza impacta investimentos privados? Uma análise empírica dos dados para o Brasil
Fonte: EARL
Briefing: Não é novidade para ninguém que as empresas, para sobreviver, precisam tornar-se “data driven companies”. Uma das ferramentas mais utilizadas pelos cientistas de dados e pelas empresas para buscar insigths nos dados é o software R. Para discutir como o R pode ser aplicado para resolver os problemas das empresas surgiu o EARL - Enterprise Applications of the R Language Conference.
What is EARL? The Enterprise Applications of the R Language Conference (EARL) is a cross-sector conference focusing on the commercial use of the R programming language. The conference is dedicated to the real-world usage of R with some of the world’s leading practitioners. Plus, networking opportunities provide an opportunity to network with speakers and fellow delegates.}
Fonte: Data Science Central
Briefing: No último post (abaixo) nós compartilhamos um artigo bem simples sobre as atribuições do engenheiro de dados e do cientista de dados. Esse artigo deixa a discussão um pouco mais complexa e mostra diferenças importantes entre diversos tópicos e carreiras relacionados à ciência de dados.
Fonte: Ciência e Dados
Briefing: Uma dúvida que permeia entre os praticantes dessa nova ciência, a ciência de dados, é a diferença entro o cientista de dados e o engenheiro de dados. Nesse texto bem simples e curto o autor aborda algumas diferenças que podem ajuda-lo a definir um pouco melhor cada uma das profissões. Claro que as intersecções entre as duas profissões são enormes. Aproveitem a leitura!
Fonte: Rob Hyndman
Briefing: Na semana passada, o prof. Rob Hyndman, um dos mais expoentes pesquisadores em modelos de séries temporais do mundo, apresentou seu novo pacote chamado “Fable”. Esse é um pacote muito interessante pois possui as seguintes características: (i) integrado aos pacotes do tidyverse;(ii) construído para prever diversas séries temporais; (iii) flexível a transformações; (iv) trabalha bem com dados intra diários e múltiplas sazonalidades.
Em um mundo em que precisamos automatizar a previsão de muitas séries com múltiplos ciclos sazonais, este parece ser um pacote bem útil. Além do link para a apresentação que enviamos acima, segue o link para o estudo que fizemos baseado na apresentação do Hyndman - http://rpubs.com/modelthinkingbr/fable.
Fonte: InfoWorks
Briefing:Este pequeno artigo mostra a importância do engenheiro de dados para as empresas. Segundo a Gartner, apenas 15% dos projetos de Big data entram em produção e uma das razões para isso é a falta de bons engenheiros de dados. Segundo o artigo, para cada cientista de dados as empresas necessitam de 2 engenheiros de dados.
Fonte: Royal Statistical Society
Briefing: Existe um jargão, muito usado pelas consultorias e consultores em “analytics”, que diz: “dado é igual petróleo, precisa ser retirado e processado para ter valor”. Nesse artigo, os autores Sofia Olhede e Russell Rodrigues mostram que as coisas não são bem assim. Por exemplo, ao contrário das commodities que tem valor em si, os dados, em geral, são usados como insumo para maximizar as vendas de um outro produto. Os autores exploram também conceitos importantes em data science como “data wrangling”.
Fonte: Emily Robinson
Briefing: Este artigo foi escrito pela Emily Robinson, cientista de dados da Datacamp. Ele é bem interessante pois aborda alguns pontos a serem observados em uma entrevista para a vaga de cientista de dados pela ótica da pessoa que está sendo entrevistada. A autora ressalta, por exemplo, os riscos de aceitar uma vaga para cientista de dados em uma empresa que está começando a desenvolver a área de data science e tornar-se um engenheiro de dados e também, a importância de ter uma equipe em que os códigos/resultados possam ser revisados pelos pares. Apesar de ser direcionado aos entrevistados, o artigo aborda pontos interessantes que devem ser observados ao construir uma área de data science.
Fonte: The Talking Machines
Briefing: “Talking Machines” é apresentado em dupla pela jornalista Katherine Gorman e algum pesquisador renomado em ML. O Talking Machines explica alguns dos aspectos técnicos do ML de maneira bem didática, e entrevista com frequência excelentes especialistas. Neste link são entrevistados três expoentes na área de deep learning, Geoff Hinton, Yann LeCun e Yoshua Bengio. Recomendamos o minuto 04:37 onde se discute as interseções e diferenças entre estatística e machine learning e a partir do minuto 10:45 os entrevistados falam sobre deep learning, supervised learning e distributed representation.
Fonte: London Business School
Briefing: neste podcast professores da London Business School discutem sobre data science e como isso pode afetar a sua empresa. Segundo Nicos Savva, business leaders não precisam entender todos os dados, mas eles precisam entender os problemas do negócio que os cientistas de dados podem ajudar a resolver.
Este clipping é produzido por:
Model Thinking Br1
contato@modelthinkingbr.com