R é uma linguagem utilizada primariamente para manipulação de dados, iremos iniciar essa aula apresentando brevemente os tipos de variáveis existentes na linguagem e como realizar atribuições e cálculos. O intuito desse curso não é apresentar a vocês toda a sintaxe e todas as funções úteis do R e sim mostrar aplicações reais do mesmo em Engenharia de Produção.
# Tudo após # é comentário, não código, portanto não será executado.
# Número
a <- 3
# Texto / String
a <- "Magali"
# Listas
a <- c(1,2,3,4,5,6)
b <- c("magali","2","kiara")
c <- c(1,"ana",3,4,"flavia")
# Variáveis Lógicas (usam operadores lógicos)
a <- FALSE
a <- 0 < 1
print(a)
## [1] TRUE
a <- TRUE & FALSE
print(a)
## [1] FALSE
b <- 3
b <- sqrt(b*b+3) # Função de raiz quadrada
b
## [1] 3.464102
b <- b - 2
round(b) # arredondamento
## [1] 1
a <- c(13,5,32,41,15,0.6)
a[2] # acessando um item da lista a pelo seu índice
## [1] 5
mean(a)
## [1] 17.76667
sum(a)
## [1] 106.6
median(a)
## [1] 14
help() é um comando que ajudará muito na utilização do R, qualquer dúvida sobre o funcionamento de funções, sejam elas presentes em pacotes ou não pode ser sanada ao utilizá-lo.
Existe também uma documentação extensa disponível online.[https://www.r-project.org]
Nesse primeiro momento iremos utilizar uma base de dados nativa do R para fins demonstrativos.
data <- cars
summary(data) # Função que sumariza os dados da tabela trazendo informações importantes sobre os mesmos
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
data$speed # Seleciona uma coluna (nesse caso a speed)
## [1] 4 4 7 7 8 9 10 10 10 11 11 12 12 12 12 13 13 13 13 14 14 14 14
## [24] 15 15 15 16 16 17 17 17 18 18 18 18 19 19 19 20 20 20 20 20 22 23 24
## [47] 24 24 24 25
mean(data$dist)
## [1] 42.98
A manipulação de dados será mais aprofundada ao realizarmos os estudos de caso.