INTRODUÇÃO À ESTATÍSTICA

SEMANA 1: INTRODUÇÃO AO R-STUDIO

PROF. GUILHERME AUGUSTO VELOSO

PRIMEIRO SEMESTRE DE 2023

1 Os softwares R e R-STUDIO

O R é, ao mesmo tempo, uma linguagem de programação e um software gratuito de código aberto para visualização de dados e computação estatística.

O que é uma linguagem de programação? É por onde a máquina e o programador se comunicam. É uma linguagem formal que funciona por meio de uma série de instruções, símbolos, palavras-chave, regras semânticas e sintáticas.

No nosso curso de Introdução à estatística, o R será fundamental para aplicarmos, de maneira prática, todos os conhecimentos vistos em sala. Mas antes disso, é necessária uma breve introdução para que vocês se habituem ao software.

1.1 Por que escolher o R?

  • É possível rodar o R em praticamente qualquer computador ou sistema operacional (Windows, macOS, Linux, etc.).
  • De fato, alguns usuários conseguem rodar R em smartphones e até em vídeo-games!
  • Por ser gratuito e de código aberto, ele pode ser livremente utilizado ou mesmo modificado (tanto em ambiente doméstico quanto em ambiente comercial).
  • Através da instalação de pacotes (ou packages) é possível aumentar as capacidades do R.

1.1.1 Como instalar o R

Para instalar a última versão do R, siga os seguintes passos:

  • Faça download do arquivo de acordo com seu sistema operacional.
  • Se for Windows, vá em install R for the first time:
  • Clique em Download e siga com a instalação padrão:
  • Pronto, após a instalação do R, teremos o seguinte software:

1.2 O R-STUDIO

O R-STUDIO é uma interface funcional e amigável para o R. Inclui recursos que permite: aumentar a produtividade e é executado em todas as principais plataformas. Sua interface facilita o uso do R..

1.2.1 Como instalar o R-STUDIO

Para instalar a última versão do R-Studio, siga os seguintes passos:

  • Vá no site https://posit.co/download/rstudio-desktop/;
  • Faça download da versão do R-Studio de acordo com o seu sistema operacional;
  • Caso o sistema operacional seja Windows, basta ir em:
  • Clique em executar (faça a instalação padrão).
  • Após a instalação, abra o R-Studio:

2 Primeiros passos no R-STUDIO

Para compreender as interfaces básicas do R-STUDIO, vá em fileNew fileR Script e abrirá uma janela. Assim, o R-STUDIO possui os seguintes painéis:

  • Editor/Script: onde serão escritos todos os códigos.
  • Console: onde os códigos são compilados e, caso tenha algum erro na estrutura do código, o erro é apresentado nesse painel.
  • Objetos: painel com todos os objetos criados no presente trabalho.
  • History: painel com um histórico dos comandos rodados.
  • Files: mostra os arquivos no diretório de trabalho. É possível navegar entre diretórios.
  • Plots: painel onde os gráficos serão apresentados.
  • Help: janela onde a documentação das funções serão apresentadas.

2.1 Funções

As funções em R seguem a mesma lógica de funções matemáticas:

y=f(x)

A função acima informa que a variável y depende dos valores de x para ser definida. O termo x é o que chamamos de argumento da função. Assim, por exemplo, se x é um vetor de números e f(x) fornece a média de x, temos no R:

y=mean(x)

Assim, no R, sempre trabalharemos com funções que dependerão de um ou mais argumentos para que funcionem de maneira correta.

2.2 Executar (ou rodar) o código no R

Quando colocamos a nossa linha de código ou até mesmo todo o nosso script no editor de texto do R, ele não irá fazer NADA. A menos que você dê uma ordem para o R executar (rodar) o seu código.

Para executar o seu código, existem duas formas!

Usando o teclado: ctrl + Enter

Usando o mouse: clique no botão Run

Essa ordem pode ser para executar apenas uma linha de código, um conjunto de linhas ou até mesmo todo o seu script.

Você escolhe!

O que vai definir a parte do código que será executada?

Depende do que está selecionado pelo seu mouse!

Por exemplo, se você selecionar todas as linhas do script e pedir para executar, todo o script será executado.

Se você selecionar só uma parte, só essa parte irá rodar.

3 Manipulação de objetos no R

A linguagem R é orientada a objetos e, na prática, isso significa que tudo no R será um objeto.

Imagine que esse “objeto” é uma variável capaz de armazenar um valor ou uma estrutura de dados e o operador de atribuição é representado pelo “=” ou “<-”. Exemplo:

variavel1 = 5
variavel2 <- 2

Nesse exemplo, estou atribuindo o valor 5 para o objeto “variavel1” e o valor 2 ao objeto “variável2”, ambos criados por mim.

Para escrever comentários em seu código no R, basta apertar o “#” e tudo que será escrito na frente dele virá como comentário:

# definindo o objeto variável1
variavel1 = 5 
# definindo o objeto variável2
variavel2 <- 2

Os comentários são excelentes estratégias na criação dos códigos para facilitar o entendimento do que está sendo feito.

Para criar palavras ou frases, elas devem vir entre aspas na sua definição:

# definindo o objeto variável3
variavel3 = "Niterói" 
# definindo o objeto variável4
variavel4 = "Rio de Janeiro" 

De um modo geral, você vai escolher o nome que mais fizer sentido para o seu objeto, de forma que fique fácil de saber do que se trata. Os nomes dos objetos não podem começar com números e com caracteres especiais. O R diferencia letras maiúsculas de minúsculas.

3.1 Vetores

Conjunto de elementos de uma mesma natureza. Podem ser numéricos ou não e a função “c” irá organizar os valores em um vetor e os elementos do vetor são separados por vírgula. Exemplos:

# Criando o vetor com os nomes de algumas cidades
cidade = c("Rio de Janeiro", "Niterói", "São Gonçalo", "Maricá", "Caxias", "Nilópolis", "Resende", "Macaé")
# Visualizando o vetor 
cidade
## [1] "Rio de Janeiro" "Niterói"        "São Gonçalo"    "Maricá"        
## [5] "Caxias"         "Nilópolis"      "Resende"        "Macaé"

Suponha que seja de interesse investigar o número de roubos nessas cidades em duas semanas:

# Criando o vetor número de roubos na 1ª semana por cidade
roubos_1sem = c(20,30,40,23,22,19,32,42)
# Visualizando o vetor 
roubos_1sem
## [1] 20 30 40 23 22 19 32 42
# Criando o vetor número de roubos na 2a semana por cidade
roubos_2sem = c(12,39,49,13,25,19,52,18)
# Visualizando o vetor
roubos_2sem
## [1] 12 39 49 13 25 19 52 18

No Rtemos as classes dos caracteres e dos números, basicamente. Existem outras classes mas não serão nosso foco agora.

# Checando a classe de um vetor
class(cidade)
## [1] "character"
class(roubos_2sem)
## [1] "numeric"

A simbologia utilizada pelo R para operadores aritméticos elementares é apresentada na tabela seguinte:

Assim, podemos realizar operações com os vetores:

# Dividindo o número de roubos da segunda semana por 7
roubos_2sem / 7
## [1] 1.714286 5.571429 7.000000 1.857143 3.571429 2.714286 7.428571 2.571429
# Somando os roubos nas duas semanas
roubos_1sem + roubos_2sem
## [1] 32 69 89 36 47 38 84 60
# Acessando elemento(s) de um vetor
roubos_1sem[2]
## [1] 30
roubos_1sem[-2]
## [1] 20 40 23 22 19 32 42
roubos_1sem[c(1,3)]
## [1] 20 40

Aplicando funções básicas:

# Máximo
max(roubos_1sem)
## [1] 42
# Mínimo
min(roubos_1sem)
## [1] 19
# Posição do valor máximo no vetor
which.max(roubos_1sem)
## [1] 8
# Posição do valor mínimo no vetor
which.min(roubos_1sem)
## [1] 6
# Tamanho do vetor
length(roubos_1sem)
## [1] 8
# Ordenar o vetor
sort(roubos_1sem)
## [1] 19 20 22 23 30 32 40 42

Observação: para criar números “quebrados”, o R utiliza o “ponto” como separador decimal:

# Raiz quadrada:
R = sqrt(22)
R
## [1] 4.690416

3.2 Exercícios

  • Crie um vetor chamado de Alunos com os nomes Adriana, Carlos, Gustavo, Pedro, Letícia e Mariana.
  • Crie um vetor chamado de Notas1 para armazenar as notas na primeira prova e inclua os valores: 45, 60, 80, 95, 31 e 77. Calcule a média e encontre os valores mínimo e máximo.
  • Crie um vetor chamado de Notas2 para armazenar as notas na segunda prova e inclua os valores: 80, 45, 78, 46, 23 e 86. Calcule a média e encontre os valores mínimo e máximo.
  • Assuma que a primeira prova tenha um peso 0.7 e a segunda prova um peso de 0.3. Considere que a nota final dos alunos será dada pela soma das duas provas multiplicadas pelos respectivos pesos. Armazene a nota final dos alunos na variável NotasF

4 Pedindo ajuda no R

A documentação do R traz tudo o que nós precisamos saber para usarmos uma determinada função.

?mean
help(mean)

Com os comandos acima, é possível ter uma breve descrição do que a referida função executa bem como a definição de todos os seus argumentos.

5 Salvando sua sessão no R

Para salvar seu script, basta ir em FileSave. Para encerrar, basta apertar o “X”.