Oficina R básico

Apresentação do R

R é um ambiente de análise estatística inicialmente criado e desenvolvido por Ross Ihaka e Robert Gentleman em 1996. Pode ser considerado como uma implementação da linguagem S, que foi desenvolvida nos Laboratórios Bell, companhia norte americana de telecomunicações.

R pode ser usado tanto como uma linguagem de programação quanto como um pacote de software que você pode utilizar para manipular dados, realizar cálculos, conduzir análises estatísticas e exibir gráficos. Algumas vantagens de usar R incluem:

  • R é de código aberto e está disponível gratuitamente.

  • R possui um conjunto extenso e coerente de ferramentas para análise estatística.

  • R oferece uma capacidade gráfica altamente flexível, capaz de produzir figuras de qualidade para publicação.

  • R tem um conjunto em expansão de “pacotes” gratuitos de rotinas para análises especiais ou incomuns.

  • R possui uma rede de suporte extensa, com inúmeros documentos online disponíveis gratuitamente.

Instalando o R:

https://www.r-project.org/

Download -> CRAN -> Brazil -> Escolher um dos mirrors (UFPR)

Rstudio

https://www.rstudio.com/

Versões antigas

https://www.rstudio.com/products/rstudio/older-versions/

Organizando o espaço de trabalho

  • Barra de menu, barra de ferramentas

  • Console, pastas de trabalho, objetos

Tipos de arquivo R

Tipos de objetos

Existem diferentes tipos de objetos que podem ser usados para armazenar e manipular dados. Esses objetos variam em complexidade, desde estruturas básicas, como vetores, até estruturas mais complexas, como listas e data frames.

1. Vetores (vector)

São um objeto básico de dados que armazena uma sequência de elementos do mesmo tipo.

  • Tipos de vetores incluem:

    • Numéricos (numeric): Contêm números inteiros ou decimais (double - números reais, com casas decimais).

    • Caractere (character): Contêm cadeias de texto (strings, pode ser alfanumérico).

    • Lógicos (logical): Contêm valores booleanos (TRUE ou FALSE).

    • Fator (factor): Armazenam dados categóricos. Muito usados para representar variáveis qualitativas, como níveis ou grupos. Criados com a função factor().

    • Inteiros (integer): Vetores que armazenam números inteiros.

    • Complexos (complex): Vetores de números complexos.

2. Matrizes (matrix)

  • São vetores bidimensionais que armazenam dados em linhas e colunas, todos do mesmo tipo.

  • Criadas com a função matrix().

3. Data Frames (data.frame)

  • São uma tabela de dados com colunas que podem conter diferentes tipos de dados (por exemplo, numéricos, caracteres e lógicos ao mesmo tempo).

  • São amplamente usados para armazenar dados em formato tabular (semelhante a uma planilha).

  • Criados com a função data.frame().

4. Tibble (pacote tibble)

  • Uma versão aprimorada dos data frames, que faz parte do pacote tidyverse.
  • Oferece melhor legibilidade e funcionalidades adicionais para trabalhar com dados tabulares.

Outros

  • Array

  • Listas

  • Funções

  • Modelos estatísticos

  • etc.