No momento em que escrevo este documento, uma das grandes dificuldades que a Meios Jr passa é, em minha visão, a dedicação excessiva dos membros a tarefas pontuais de suas respectivas coordenadorias, em detrimento à execução de mais projetos de fato - que contribuiriam com a formação específica do cientista social.
Um dos pilares desse problema é o processo de repasse do conhecimento. Ainda que existam projetos em andamento, é comum que os membros (em especial os recém-ingressantes na empresa) se sintam acanhados em se integrar e fazer parte das atividades. Uma parcela do problema decorre das dificuldades comunicacionais inatas ao trabalho remoto, e outra, talvez até mais expressiva , da sensação de incapacidade técnica para contribuir na execução dos projetos.
Nesse sentido, gostaria de deixar uma coisa registrada:
Ainda que os projetos que realizamos sejam pagos e absolutamente sérios do ponto de vista do trabalho empregado e da utilidade final de mercado, somos uma empresa júnior. Isso significa que é absolutamente esperado que cometamos erros ao longo do processo, e a exposição a possibilidade de errar - e errar de fato -, é crucial para o nosso desenvolvimento profissional. Por isso, não tenham medo de participar das atividades!
O esforço que está sendo feito neste documento deve ser replicado nas próximas gestões da Meios Jr, pois muitas vezes - se não sempre -, os membros da empresa são os únicos capazes de realizar capacitações contextualizadas e direcionadas para os problemas específicos da Meios. Além disso, por ter uma rotatividade grande de pessoas, a continuação da Meios depende do repasse desses conhecimentos, que preferencialmente devem ser disponibilizados nos Drives da empresa para visualização futura.
Grande parte dos trabalhos que executamos na Meios envolvem os seguintes passos, que são bem ilustrados pelo infográfico abaixo.
Saber realizar análise de dados é fundamental para as atividades que nos propomos a executar, e é absolutamente indispensável do ponto de vista da carreira e empregabilidade - independente de ser acadêmica ou de mercado.
O R, junto ao Python, são hoje as duas maiores linguagens de programação de análise de dados do mercado mundial. Diferentemente do Excel, Google Sheets, SPSS, Stata, SAS, etc, que estão em rápido declínio. Isso quando são citados.
O R possui uma ênfase mais acadêmica (apesar de estar crescendo rapidamente no mercado), e é mais comum encontrar utilizadores da linguagem nas áreas da Estatística, Demografia e Estudos Médicos. Já no caso do Python, é mais comum encontrar cientistas da computação, cientistas de dados, programadores de outras coisas (que não sejam necessariamente análise de dados), e pessoas que trabalham com Machine Learning, Deep Learning, etc. Coisas interessantes, mas que fogem aos nossos propósitos aqui.
Nesse sentido, acredito que seja mais útil, do ponto de vista da empregabilidade e da funcionalidade (as possibilidades são praticamente infinitas), encarar a curva de aprendizado mais complexa que o R possui, do que realizar o trabalho nos outros softwares, que ainda que tenham uma interface mais amigável, são mais limitados, e estão lutando pra permanecer relevantes no mercado.
Quando usar cada tipo de gráfico?
Gráficos de barras
Histogramas
Boxplots
Diagramas de dispersão / gráficos de pontos / scatterplots
A Gramática de Gráficos
Quais os componentes de um ggplot? Por que isso importa?
Construindo gráficos
geom_bar(), geom_col(), geom_histogram(), geom_boxplot e geom_point()
Produção de nuvens de palavras com o wordcloud