CONCEITOS EM R
1 Introdução
Este documento apresenta os principais conceitos e funções para importação e manipulação de dados no R, abordando desde a leitura de diferentes fontes de dados até operações básicas de análise e filtragem.
2 Importação de Dados
O Pacote readxl: Função read_xlsx(). O pacote readxl é especializado na leitura de arquivos do Excel (.xlsx, .xls). A função read_xlsx() é a mais utilizada para importar dados de planilhas Excel.
Pacote readr: função read_delim(). O pacote readr faz parte do tidyverse e oferece funções rápidas para leitura de dados retangulares (CSV, etc).
— Argumento “path”: O argumento path (ou file) indica o caminho do arquivo que será lido. Pode ser um caminho relativo (ex: “dados/exemplo.xlsx”) ou absoluto (ex: “C:/Users/…/exemplo.xlsx”).
– Argumentos principais:
“file”: Nome do arquivo ou conexão
“delim”: Caractere delimitador (“,” para CSV)
- Pacote googlesheets4: função read_sheet(). Permite ler dados diretamente do Google Sheets.
– Argumento “ss”: ID da planilha ou URL do Google Sheets.
2.1 Exemplos
3 Combinação de tabelas
Muitas vezes é necessário juntar dados de diferentes fontes. O R permite combinar tabelas tanto vertical quanto horizontalmente.
- Função “rbind()”
Combina data frames por linhas (empilha verticalmente). Empilha tabelas uma embaixo da outra, desde que tenham as mesmas colunas.
- Função “cbind()”
Combina data frames por colunas (lado a lado). Desde que tenham o mesmo número de linhas.
3.1 Exemplos
df1 <- data.frame(A = 1:3, B = letters[1:3])
df2 <- data.frame(A = 4:6, B = letters[4:6])
df_combinado <- rbind(df1, df2)
df3 <- data.frame(C = 7:9, D = letters[7:9])
df_largura <- cbind(df_combinado, df3)
print(df_combinado)## A B
## 1 1 a
## 2 2 b
## 3 3 c
## 4 4 d
## 5 5 e
## 6 6 f
## A B C D
## 1 1 a 7 g
## 2 2 b 8 h
## 3 3 c 9 i
## 4 4 d 7 g
## 5 5 e 8 h
## 6 6 f 9 i
4 Estrutura e dimensões dos dados
Após importar os dados, é importante compreender sua estrutura e dimensões.
4.1 Exemplo
dados <- data.frame(
Nome = c("Ana", "Bruno", "Carlos", "Daniela"),
Idade = c(25, 30, 22, 28),
Nota = c(8.5, 9.2, 7.8, 8.9)
)
ncol(dados) # Número de colunas## [1] 3
## [1] 4
## [1] 4 3
## Nome Idade Nota
## 1 Ana 25 8.5
## 2 Bruno 30 9.2
## 3 Carlos 22 7.8
## 4 Daniela 28 8.9
## Nome Idade Nota
## 1 Ana 25 8.5
## 2 Bruno 30 9.2
## 3 Carlos 22 7.8
## 4 Daniela 28 8.9
## 'data.frame': 4 obs. of 3 variables:
## $ Nome : chr "Ana" "Bruno" "Carlos" "Daniela"
## $ Idade: num 25 30 22 28
## $ Nota : num 8.5 9.2 7.8 8.9
5 Seleção e subconjuntos
É comum querer selecionar linhas ou colunas específicas de um conjunto de dados.
5.1 Seleção por índice
Selecionando a primeira coluna: dados[, 1]
Selecionando as duas primeiras linhas: dados[1:2, ]
5.2 Seleção por nome
Selecionando a coluna “Nota”: dados$Nota
Ou usando colchetes: dados[, “Nota”]
6 Funções estatísticas básicas
O R possui várias funções estatísticas nativas que facilitam análises exploratórias.
6.1 Exemplo
## [1] 10
## [1] 30
## [1] 20
## [1] 7.905694
## [1] 20
## [1] 20
7 Comparações lógicas
7.1 Verificando tipos e datas
## [1] "numeric"
## [1] "2025-10-29"
7.2 Operadores lógicos
| Operador | Significado | Exemplo | Resultado |
|---|---|---|---|
| > | Maior que | 5 > 3 | TRUE |
| < | Menor que | 5 < 3 | FALSE |
| == | Igual a | 5 == 5 | TRUE |
| != | Diferente de | 5 != 3 | TRUE |
| >= | Maior ou igual a | 5 >= 5 | TRUE |
| <= | Menor ou igual a | 4 <= 3 | FALSE |
| %in% | Pertence ao conjunto | 2 %in% c(1,2,3) | TRUE |
| ! | Negação lógica | !TRUE | FALSE |
8 Operadores compostos
8.1 Regra do E (&)
O operador E lógico (&) retorna TRUE apenas se ambas as condições forem verdadeiras.