<div style="display: flex; align-items: center; justify-content: center; gap: 30px; text-align: center;"> <div> <h1>Pré-processamento e Tratamento de Dados com Tidyverse em R</h1> <p style="font-size: 22px; font-weight: bold;">Jessica Quintanilha Kubrusly</p> <p><a href="mailto:jessicakubrusly@id.uff.br" style="font-size:16px; color: black;">jessicakubrusly@id.uff.br</a></p> <p style="font-size: 22px; font-weight: bold; margin-top: 10px;">Patrícia Lusié Velozo da Costa</p> <p><a href="mailto:patricialusie@id.uff.br" style="font-size:16px; color: black;">patricialusie@id.uff.br</a></p> <p style="font-size: 16px; margin-top: 50px;">Universidade Federal Fluminense</p> <p style="font-size: 16px;">Instituto de Matemática e Estatística</p> <p style="font-size: 16px;">Departamento de Estatística</p> <p style="font-size: 16px; margin-top: 50px;">25 de Novembro de 2025</p> </div> <div> <img src="figuras/logo_Tidyverse_hex.png" style="max-width:150px;"> </div> </div> --- # Mini bio da Jessica Quintanilha Kubrusly - Graduou-se em Engenharia Elétrica pela PUC-Rio em 2003. - Mestre (2005) e Doutora (2009) em Matemática pela PUC-Rio. - Suas áreas de interesse e atuação incluem Árvores de Decisão, Aprendizado de Máquina, Mineração de Texto, Sistemas de Recomendação e Filtragem Colaborativa. - Chefe do Departamento de Estatística (GET) da UFF desde 2023. - Professora associada do <a href="https://www.est.uff.br" target="_blank" style="color: #6f42c1; text-decoration: none; font-weight: bold;">Departamento de Estatística da Universidade Federal Fluminense (UFF)</a>. - Membro do programa de extensão <a href="https://www.les.uff.br" target="_blank" style="color: #6f42c1; text-decoration: none; font-weight: bold;">Laboratório de Estatística/UFF</a>. - Atua na organização de eventos como a <a href="https://www.semest.uff.br" target="_blank" style="color: #6f42c1; text-decoration: none; font-weight: bold;">Semana da Estatística/UFF</a> e o <a href="https://www.instagram.com/rladies.niteroi" target="_blank" style="color: #6f42c1; text-decoration: none; font-weight: bold;">RLadies Niterói</a> da UFF. --- # Mini bio da Patrícia Lusié Velozo da Costa - Doutora (2014) e Mestre (2009) em Estatística pela Universidade Federal do Rio de Janeiro (UFRJ). - Graduada em Matemática (2007) pela UFRJ. - Professora associada do <a href="https://www.est.uff.br" target="_blank" style="color: #6f42c1; text-decoration: none; font-weight: bold;">Departamento de Estatística da Universidade Federal Fluminense (UFF)</a>. - Membro do programa de extensão <a href="https://www.les.uff.br" target="_blank" style="color: #6f42c1; text-decoration: none; font-weight: bold;">Laboratório de Estatística/UFF</a>. - Atua na organização de eventos como a <a href="https://www.semest.uff.br" target="_blank" style="color: #6f42c1; text-decoration: none; font-weight: bold;">Semana da Estatística/UFF</a> e o <a href="https://www.instagram.com/rladies.niteroi" target="_blank" style="color: #6f42c1; text-decoration: none; font-weight: bold;">RLadies Niterói</a> da UFF. --- # Participação feminina nas áreas de Exatas - Apesar dos avanços em inclusão no ensino superior, a participação feminina nas áreas de Exatas ainda é significativamente menor do que a masculina. - Segundo a UNESCO (2021), apenas **30% dos pesquisadores em STEM** (ciência, tecnologia, engenharia e matemática) no mundo são mulheres. - No Brasil, os dados do INEP (2022) mostram que, embora as mulheres sejam maioria nas universidades, continuam sub-representadas em cursos como matemática, física, engenharia e computação. - Essa desigualdade de gênero ainda reflete barreiras sociais, culturais e institucionais que precisam ser enfrentadas. --- # Sobre o R-Ladies - O **R-Ladies** é uma organização global que promove a **diversidade de gênero na comunidade R**, incentivando a participação ativa de **mulheres e minorias de gênero** no uso e desenvolvimento do R. - Embora a prioridade seja valorizar e evidenciar que as mulheres têm plena capacidade e alcançam sucesso na área, a participação dos homens é muito bem-vinda e enriquecedora, seja nos minicursos, palestras ou nas discussões. - No Brasil e no mundo, os capítulos do R-Ladies realizam eventos, workshops, grupos de estudo e ações de networking para fortalecer a comunidade. **Saiba mais:** - <img src="figuras/logo-rladies.jpg" style="max-width:50px;vertical-align: middle;"> [R-Ladies Global](https://rladies.org/) - <img src="figuras/logo-rladies-niteroi.png" style="max-width:70px;vertical-align: middle;"> [R-Ladies Niterói](https://www.instagram.com/rladies.niteroi/) --- # Objetivos do minicurso - Apresentar o ecossistema **Tidyverse** - Demonstrar técnicas práticas de: - Importação - Limpeza - Transformação - Organização de dados - Preparar dados para: - análises estatísticas - visualizações - Mostrar boas práticas de reprodutibilidade --- # O que é Tidyverse? O **tidyverse** é um conjunto de pacotes do R voltados para ciência de dados, desenvolvidos para trabalhar de forma integrada e com sintaxe consistente. Principais características: - 📦 Conjunto de pacotes integrados - 🧹 Foco em dados *tidy* (organizados) - 🔗 A gramática é coerente entre os pacotes - 🚀 Facilita leitura, transformação, modelagem e visualização de dados Pacotes centrais: - **dplyr** – manipulação de dados - **tidyr** – organização e "arrumação" dos dados - **ggplot2** – visualização - **readr** – importação - **purrr** – programação funcional - **tibble** – data frames modernos --- # Introdução ao Processamento de Dados O processamento de dados é a etapa que transforma dados brutos em informações úteis para análise. Etapas fundamentais: 1. **Importação** - leitura de arquivos (.csv, .xlsx, .rds, bancos de dados etc.) 2. **Limpeza** - tratamento de valores faltantes - correção de tipos (datas, fatores, números) - padronização de categorias --- # Introdução ao Processamento de Dados (continuação) 3. **Transformação** - criação de novas variáveis - agregação, filtragem, ordenação - junções entre bases 4. **Organização** - dados no formato *longo* ou *largo* - estruturação de tabelas para análises futuras 5. **Documentação** - registrar passos e decisões tomadas - garantir reprodutibilidade --- # Introdução ao Processamento de Dados (continuação) Ferramentas comuns no R: - **tidyverse** (dplyr, tidyr, readr) - **janitor** - **lubridate** - **stringr** --- # Dados utilizados Neste minicurso, utilizaremos os dados de mortalidade do Sistema de Informações sobre Mortalidade (SIM), referentes ao ano de 2024 para o estado do Rio de Janeiro. O SIM é a principal fonte oficial de informações sobre óbitos no Brasil, permitindo análises epidemiológicas, espaciais e temporais. A base contém variáveis como: - causa do óbito (CID-10) - sexo, faixa etária - município de residência e ocorrência - datas relevantes (óbito, nascimento) - informações adicionais do atestado de óbito Esses dados são ideais para demonstrar técnicas de importação, limpeza, transformação e preparo para análises estatísticas no Tidyverse. --- # Vamos colocar a mão na massa! 🧰✨ <div style="text-align: center; margin-top: 30px;"> <p style="font-size: 22px; font-weight: bold;"> 📂 Acesse os arquivos do minicurso </p> <a href="https://drive.google.com/drive/folders/14KuBVYoMwOo5F0EL-tl3H4H4oxhl8wmN?usp=sharing" target="_blank" style="font-size: 22px; color: #3366cc; font-weight: bold; text-decoration: none;"> 👉 Clique aqui para abrir a pasta no Google Drive </a> <p style="font-size: 18px; margin-top: 20px;"> Os materiais incluem dados, scripts e exemplos<br> que usaremos nas atividades práticas. </p> </div> --- # Referências 📖 BRASIL. Ministério da Saúde. Secretaria de Vigilância em Saúde. Sistema de Informações sobre Mortalidade – SIM. Brasília: Ministério da Saúde, [s.d.]. Disponível em: https://datasus.saude.gov.br/sistema-de-informacoes-sobre-mortalidade-sim/ . Acesso em: 25 de novembro de 2025. 📖 R Core Team. (2024). R: A Language and Environment for Statistical Computing. Vienna: R Foundation for Statistical Computing. Disponível em: [Link](https://www.R-project.org/). Acesso em: 24 maio 2025. 📖 Wickham, H.; Grolemund, G. (2023). R para ciência de dados: importe, organize, transforme, visualize e modele dados. 2. ed. Rio de Janeiro: Alta Books. --- <div style="text-align: center; font-size: 48px; font-style: italic; color: blue; margin-top: 150px;"> Muito Obrigada! </div>