PROF. GUILHERME AUGUSTO VELOSO
PRIMEIRO SEMESTRE DE 2023
R e R-STUDIOO R é, ao mesmo tempo, uma linguagem de
programação e um software gratuito de
código aberto para visualização de
dados e computação estatística.
O que é uma linguagem de programação? É por onde a máquina e o programador se comunicam. É uma linguagem formal que funciona por meio de uma série de instruções, símbolos, palavras-chave, regras semânticas e sintáticas.
No nosso curso de Introdução à estatística, o R
será fundamental para aplicarmos, de maneira prática, todos os
conhecimentos vistos em sala. Mas antes disso, é necessária uma
breve introdução para que vocês se habituem ao
software.
R?R em praticamente qualquer
computador ou sistema operacional (Windows, macOS, Linux,
etc.).R em
smartphones e até em vídeo-games!R.RPara instalar a última versão do R,
siga os seguintes passos:
install R for the first time:
Download e siga com a instalação
padrão:
R, teremos o seguinte
software:R-STUDIOO R-STUDIO é uma interface funcional e
amigável para o R. Inclui recursos que
permite: aumentar a produtividade e é executado em todas as principais
plataformas. Sua interface facilita o uso do R..
R-STUDIOPara instalar a última versão do
R-Studio, siga os seguintes passos:
R-Studio de
acordo com o seu sistema operacional;R-Studio:R-STUDIOPara compreender as interfaces básicas do
R-STUDIO, vá em file → New file →
R Script e abrirá uma janela. Assim, o
R-STUDIO possui os seguintes painéis:
As funções em R seguem a mesma lógica de funções
matemáticas:
A função acima informa que a variável y depende dos valores de x para ser definida. O termo x é o que chamamos de argumento da função. Assim, por exemplo, se x é um vetor de números e f(x) fornece a média de x, temos no R:
y=mean(x)
Assim, no R, sempre trabalharemos com funções
que dependerão de um ou mais argumentos para que funcionem de
maneira correta.
Quando colocamos a nossa linha de código ou até mesmo todo o nosso script no editor de texto do R, ele não irá fazer NADA. A menos que você dê uma ordem para o R executar (rodar) o seu código.
Para executar o seu código, existem duas formas!
Usando o teclado: ctrl + Enter
Usando o mouse: clique no botão Run
Essa ordem pode ser para executar apenas uma linha de código, um conjunto de linhas ou até mesmo todo o seu script.
Você escolhe!
O que vai definir a parte do código que será executada?
Depende do que está selecionado pelo seu mouse!
Por exemplo, se você selecionar todas as linhas do script e pedir para executar, todo o script será executado.
Se você selecionar só uma parte, só essa parte irá rodar.
RA linguagem R é orientada a objetos e,
na prática, isso significa que tudo no R será um
objeto.
Imagine que esse “objeto” é uma variável capaz de armazenar um valor ou uma estrutura de dados e o operador de atribuição é representado pelo “=” ou “<-”. Exemplo:
variavel1 = 5
variavel2 <- 2
Nesse exemplo, estou atribuindo o valor 5 para o objeto “variavel1” e o valor 2 ao objeto “variável2”, ambos criados por mim.
Para escrever comentários em seu código no
R, basta apertar o “#” e tudo que será
escrito na frente dele virá como comentário:
# definindo o objeto variável1
variavel1 = 5
# definindo o objeto variável2
variavel2 <- 2
Os comentários são excelentes estratégias na criação dos códigos para facilitar o entendimento do que está sendo feito.
Para criar palavras ou frases, elas devem vir entre aspas na sua definição:
# definindo o objeto variável3
variavel3 = "Niterói"
# definindo o objeto variável4
variavel4 = "Rio de Janeiro"
De um modo geral, você vai escolher o nome que mais fizer
sentido para o seu objeto, de forma que fique
fácil de saber do que se trata. Os nomes dos objetos
não podem começar com números e com caracteres
especiais. O R diferencia letras
maiúsculas de minúsculas.
Conjunto de elementos de uma mesma natureza. Podem ser numéricos ou não e a função “c” irá organizar os valores em um vetor e os elementos do vetor são separados por vírgula. Exemplos:
# Criando o vetor com os nomes de algumas cidades
cidade = c("Rio de Janeiro", "Niterói", "São Gonçalo", "Maricá", "Caxias", "Nilópolis", "Resende", "Macaé")
# Visualizando o vetor
cidade
## [1] "Rio de Janeiro" "Niterói" "São Gonçalo" "Maricá"
## [5] "Caxias" "Nilópolis" "Resende" "Macaé"
Suponha que seja de interesse investigar o número de roubos nessas cidades em duas semanas:
# Criando o vetor número de roubos na 1ª semana por cidade
roubos_1sem = c(20,30,40,23,22,19,32,42)
# Visualizando o vetor
roubos_1sem
## [1] 20 30 40 23 22 19 32 42
# Criando o vetor número de roubos na 2a semana por cidade
roubos_2sem = c(12,39,49,13,25,19,52,18)
# Visualizando o vetor
roubos_2sem
## [1] 12 39 49 13 25 19 52 18
No Rtemos as classes dos caracteres e dos
números, basicamente. Existem outras classes mas não serão nosso foco
agora.
# Checando a classe de um vetor
class(cidade)
## [1] "character"
class(roubos_2sem)
## [1] "numeric"
A simbologia utilizada pelo R para operadores
aritméticos elementares é apresentada na tabela seguinte:
Assim, podemos realizar operações com os vetores:
# Dividindo o número de roubos da segunda semana por 7
roubos_2sem / 7
## [1] 1.714286 5.571429 7.000000 1.857143 3.571429 2.714286 7.428571 2.571429
# Somando os roubos nas duas semanas
roubos_1sem + roubos_2sem
## [1] 32 69 89 36 47 38 84 60
# Acessando elemento(s) de um vetor
roubos_1sem[2]
## [1] 30
roubos_1sem[-2]
## [1] 20 40 23 22 19 32 42
roubos_1sem[c(1,3)]
## [1] 20 40
Aplicando funções básicas:
# Máximo
max(roubos_1sem)
## [1] 42
# Mínimo
min(roubos_1sem)
## [1] 19
# Posição do valor máximo no vetor
which.max(roubos_1sem)
## [1] 8
# Posição do valor mínimo no vetor
which.min(roubos_1sem)
## [1] 6
# Tamanho do vetor
length(roubos_1sem)
## [1] 8
# Ordenar o vetor
sort(roubos_1sem)
## [1] 19 20 22 23 30 32 40 42
Observação: para criar números
“quebrados”, o R utiliza o “ponto” como
separador decimal:
# Raiz quadrada:
R = sqrt(22)
R
## [1] 4.690416
Alunos com os nomes Adriana,
Carlos, Gustavo, Pedro, Letícia e Mariana.Notas1 para armazenar as notas
na primeira prova e inclua os valores: 45, 60, 80, 95, 31 e 77. Calcule
a média e encontre os valores mínimo e máximo.Notas2 para armazenar as notas
na segunda prova e inclua os valores: 80, 45, 78, 46, 23 e 86. Calcule a
média e encontre os valores mínimo e máximo.NotasFRA documentação do R traz tudo o que nós
precisamos saber para usarmos uma determinada função.
?mean
help(mean)
Com os comandos acima, é possível ter uma breve descrição do que a referida função executa bem como a definição de todos os seus argumentos.
RPara salvar seu script, basta ir em
File → Save. Para encerrar,
basta apertar o “X”.