CONCEITOS EM R

1 Introdução

Este documento apresenta os principais conceitos e funções para importação e manipulação de dados no R, abordando desde a leitura de diferentes fontes de dados até operações básicas de análise e filtragem.

2 Importação de Dados

  • O Pacote readxl: Função read_xlsx(). O pacote readxl é especializado na leitura de arquivos do Excel (.xlsx, .xls). A função read_xlsx() é a mais utilizada para importar dados de planilhas Excel.

  • Pacote readr: função read_delim(). O pacote readr faz parte do tidyverse e oferece funções rápidas para leitura de dados retangulares (CSV, etc).

— Argumento “path”: O argumento path (ou file) indica o caminho do arquivo que será lido. Pode ser um caminho relativo (ex: “dados/exemplo.xlsx”) ou absoluto (ex: “C:/Users/…/exemplo.xlsx”).

– Argumentos principais:

“file”: Nome do arquivo ou conexão

“delim”: Caractere delimitador (“,” para CSV)

  • Pacote googlesheets4: função read_sheet(). Permite ler dados diretamente do Google Sheets.

– Argumento “ss”: ID da planilha ou URL do Google Sheets.

2.1 Exemplos

3 Combinação de tabelas

Muitas vezes é necessário juntar dados de diferentes fontes. O R permite combinar tabelas tanto vertical quanto horizontalmente.

  • Função “rbind()”

Combina data frames por linhas (empilha verticalmente). Empilha tabelas uma embaixo da outra, desde que tenham as mesmas colunas.

  • Função “cbind()”

Combina data frames por colunas (lado a lado). Desde que tenham o mesmo número de linhas.

3.1 Exemplos

df1 <- data.frame(A = 1:3, B = letters[1:3])
df2 <- data.frame(A = 4:6, B = letters[4:6])
df_combinado <- rbind(df1, df2)

df3 <- data.frame(C = 7:9, D = letters[7:9])
df_largura <- cbind(df_combinado, df3)

print(df_combinado)
##   A B
## 1 1 a
## 2 2 b
## 3 3 c
## 4 4 d
## 5 5 e
## 6 6 f
print(df_largura)
##   A B C D
## 1 1 a 7 g
## 2 2 b 8 h
## 3 3 c 9 i
## 4 4 d 7 g
## 5 5 e 8 h
## 6 6 f 9 i

4 Estrutura e dimensões dos dados

Após importar os dados, é importante compreender sua estrutura e dimensões.

4.1 Exemplo

dados <- data.frame(
Nome = c("Ana", "Bruno", "Carlos", "Daniela"),
Idade = c(25, 30, 22, 28),
Nota = c(8.5, 9.2, 7.8, 8.9)
)
ncol(dados) # Número de colunas
## [1] 3
nrow(dados) # Número de linhas
## [1] 4
dim(dados) # Dimensões (linhas, colunas)
## [1] 4 3
head(dados) # Primeiras linhas
##      Nome Idade Nota
## 1     Ana    25  8.5
## 2   Bruno    30  9.2
## 3  Carlos    22  7.8
## 4 Daniela    28  8.9
tail(dados) # Últimas linhas
##      Nome Idade Nota
## 1     Ana    25  8.5
## 2   Bruno    30  9.2
## 3  Carlos    22  7.8
## 4 Daniela    28  8.9
str(dados) # Estrutura completa do objeto
## 'data.frame':    4 obs. of  3 variables:
##  $ Nome : chr  "Ana" "Bruno" "Carlos" "Daniela"
##  $ Idade: num  25 30 22 28
##  $ Nota : num  8.5 9.2 7.8 8.9

5 Seleção e subconjuntos

É comum querer selecionar linhas ou colunas específicas de um conjunto de dados.

5.1 Seleção por índice

Selecionando a primeira coluna: dados[, 1]

Selecionando as duas primeiras linhas: dados[1:2, ]

5.2 Seleção por nome

Selecionando a coluna “Nota”: dados$Nota

Ou usando colchetes: dados[, “Nota”]

6 Funções estatísticas básicas

O R possui várias funções estatísticas nativas que facilitam análises exploratórias.

6.1 Exemplo

valores <- c(10, 15, 20, 25, 30)

min(valores) # Valor mínimo
## [1] 10
max(valores) # Valor máximo
## [1] 30
mean(valores) # Média
## [1] 20
sd(valores) # Desvio padrão
## [1] 7.905694
median(valores) # Mediana
## [1] 20
round(mean(valores), 2) # Arredondamento com 2 casas decimais
## [1] 20

7 Comparações lógicas

7.1 Verificando tipos e datas

x <- 10
class(x) # Verifica o tipo do objeto
## [1] "numeric"
data_atual <- Sys.Date() # Verifica  a DATA atual
data_atual 
## [1] "2025-10-29"

7.2 Operadores lógicos

Operador Significado Exemplo Resultado
> Maior que 5 > 3 TRUE
< Menor que 5 < 3 FALSE
== Igual a 5 == 5 TRUE
!= Diferente de 5 != 3 TRUE
>= Maior ou igual a 5 >= 5 TRUE
<= Menor ou igual a 4 <= 3 FALSE
%in% Pertence ao conjunto 2 %in% c(1,2,3) TRUE
! Negação lógica !TRUE FALSE

8 Operadores compostos

8.1 Regra do E (&)

O operador E lógico (&) retorna TRUE apenas se ambas as condições forem verdadeiras.

8.2 Regra do OU (|)

O operador OU lógico (|) retorna TRUE se pelo menos uma das condições for verdadeira.

xx Exemplo

idade <- 25
nota <- 8.0
(idade > 18) & (nota >= 7)
## [1] TRUE
(idade < 18) | (nota >= 7)
## [1] TRUE