Semana 2

Manipulação e visualização de dados no R

Marina Scalon

11/5/23

Objetivos e Resultados

Aula Objetivos Resultados
  • Transformacão e preparação dos dados utilizando os pacotes tidyr

  • Transformacão e preparação dos dados utilizando os pacotes dplyr

  • Exercício

  • Correção

  • Aprender os comandos e funções dos pacotes do tidyverse

  • Entender a aplicação do operador ‘pipe’

  • Fixar o conteúdo através de exercícios

  • Desenvolver a habilidade de deixar os dados no formato analítico

  • Reconhecer a importância da arrumação dos dados (data tidying)

  • Reconhecer e ser capaz de utilizar as ferramentas para manipulação e transformação dos dados

  • Aplicar as funções dos pacotes dplyr e tidyr para estruturar os dados

Hadley Wickham

https://hadley.nz/

Tidyverse

  • Conjunto de pacotes que visam:

    • Um PASSO de cada vez
    • Cada variável deve ser uma coluna, cada observação uma linha.
  • Transparência para que qualquer pessoa que veja o script consiga entender

Tidyverse

Dplyr

  • filter(): Escolher observações de acordo com seus valores
  • arrange(): reordenar linhas
  • select(): selecionar variável pelo nome
  • slice(): seleciona por linhas
  • mutate(): criar novas variáveis com as existentes modificadas
  • summarise(): colapsa muitos valores em um único sumário
  • group_by(): agrupar de acordo com determinada característica
  • reframe(), pull(), relocate(), rename(), glimpse(), distinct(), bind_cols(), bind_rows()
  • etc (ver aqui)

Dplyr

DATA WRANGLING CHEATSHEET!

Tidyr

Existe um jeito certo de estruturar dados, mas nem sempre é simples!

  • pivot_longer() ou gather(): empilha/ combina variáveis em uma coluna (estreita sua planilha)
  • pivot_wider() ou spread(): ao contrário, espalha as variáveis em colunas (expande sua planilha)
  • unite(): junta duas colunas usando um separador
  • separate(): transforma uma coluna em várias usando um separador
  • MAS tudo mudou! Pra melhor! Referências aqui

Pipe %>%

  • Rapidez ao escrever e facilidade de ler
  • Atalho (CRTL + SHIFT + m)
  • Usa o produto da operação anterior e usa como o impute da próxima operação
  • Substituir mentalmente por “depois” para entender

BORA PRO R!