Introdução ao R

EST212 - Bioestatística

Helgem de Souza

O que é o R

  • Linguagem de programação voltada para Estatística e Ciência de Dados;

  • É uma linguagem funcional, ou seja, as ações ocorrem por meio de funções aplicadas a objetos;

  • Apesar de ser um software estatístico, é utilizado por diversas áreas;

  • É uma linguagem cujo aprendizado básico é relativamente simples.

O que é o R

  • O R é um software de licença livre;

  • Para instalá-lo, basta acessar o link a seguir: https://cran.r-project.org/

  • Após sua instalação, ele apresenta a seguinte janela

O que é o R

RStudio

  • Como pudemos observar, a interface do R é bastante simples;

  • Para uma melhor utilização da linguagem, foi desenvolvido um ambiente de desenvolvimento denominado RStudio;

  • O RStudio oferece uma interface com mais opções do que a interface nativa do R

  • Ele pode ser obtido no link https://posit.co/download/rstudio-desktop/;

  • Nessa disciplina, utilizaremos o RStudio como ambiente de desenvolvimento.

RStudio

O RStudio, desenvolvido pela empresa Posit, é composto por quatro janelas:

  • Console - Janela de linha de comando, que apresenta resultados de cálculos;

  • Source - Espaço para apresentação de scripts e bases de dados;

  • Environment - Espaço destinado para visualização de objetos e histórico de cálculos

  • Files, Plots, Packages… - Espaço destinado à visualização de arquivos em pastas, gráficos, tópicos de ajuda, dentre outros.

RStudio

RStudio

  • Essas janelas podem ser organizadas conforme a preferência do usuário

  • Trabalharemos principalmente nas janelas Source e Console.

  • Agora que conhecemos o ambiente de trabalho, vamos à utilização do R como ferramenta de cálculo e análise de dados.

O R como linguagem de programação

  • O R é dito uma linguagem funcional, ou seja, todas as ações são realizadas por meio de funções aplicadas a objetos:

    • Objeto: Elemento computacional que representa uma entidade do mundo real.

    • Função: instrução que atua em um objeto, de forma bastante semelhante a uma função matemática;

  • Exemplo:

    • Objeto: número 2

    • Função: \(f(x) = \sqrt{x}\)

    • Aplicação: \(f(2) = \sqrt{2}\)

O R como linguagem de programação

O exemplo anterior seria representado da seguinte maneira em R

#Objeto: Número 2
2
[1] 2
#Função: raiz de x - Em R representada por sqrt(x)
sqrt(2)
[1] 1.414214

Perceba que a função retorna diretamente o resultado. Do mesmo modo, podemos realizar diversas operações em R.

O R como calculadora

  • A primeira e mais simples função do R é como calculadora científica

  • No R é possível a realização das mais diversas operações matemáticas e matriciais.

  • Para tal, basta utilizar seu console. Vejamos alguns exemplos básicos:

    #Soma de dois valores
    5 + 8
    [1] 13
    #Produto de dois valores
    15.3 * 6.57
    [1] 100.521
    #Seno de um ângulo
    sin(pi/2)
    [1] 1

O R como calculadora

As principais operações matemáticas são definidas pelas seguintes funções:

Aritiméticas

  • Soma: +

  • Subtração: -

  • Multiplicação: *

  • Divisão: /

  • Raiz: sqrt()

  • Potência: ^

  • \(e^x\): \(exp(x)\)

  • Módulo: \(abs()\)

Lógicas

  • Maior : \(>\)

  • Menor: \(<\)

  • Maior ou igual: \(>=\)

  • Menor ou igual: \(<=\)

  • Igual a: \(==\)

  • Diferente de: \(!=\)

  • E: &

  • Ou: |

O R como calculadora

Alguns exemplos:

#Subtração
2.5 - 0.37
[1] 2.13
#Multiplicação
5*9
[1] 45
#Raiz de -5
sqrt(-5)
[1] NaN
#Verificar se um número é maior que outro
3 > 2
[1] TRUE
#Verificar se dois números são iguais
2 == 3
[1] FALSE
#Verificar se duas palavras são diferentes
"CASA" != "casa"
[1] TRUE

O R como calculadora

Com os exemplos, podemos notar algumas características:

  • O R separa decimais por . (ponto)

  • Comparações verdadeiras retornam TRUE

  • Comparações falsas resultam em FALSE

  • Operações indefinidas resultam em NaN (not a number).

  • Caracteres são atribuídos entre aspas.

  • O R é case sensitive (diferencia minúsculas de maiúsculas)

Essas características são importantes no momento dos cálculos.

Atribuição de variáveis

  • De modo geral, não se utiliza os valores diretamente no R.

  • Os valores são atribuídos à variáveis, que podem ser utilizadas a qualquer tempo.

  • Para atribuir uma variável ao R, utiliza-se o operador <-.

  • Utiliza-se o atalho alt + - (hífen) para evitar a digitação do operador.

  • Para imprimir ou utilizar os valores, basta executar o valor no console.

  • Vejamos como atribuir as variáveis

Atribuição de variáveis

#Atribuir a x o valor 5.6 + 2.7
x <- 5.6 + 2.7

#Imprimir o valor
x
[1] 8.3
#Atribuir uma frase à variável y
y <- "Isso é uma frase"
y
[1] "Isso é uma frase"
#Salvar uma comparação lógica
z = 5 > 4
z
[1] TRUE
#Podemos atribuir e imprimir ao mesmo tempo, fazendo a atribuição entre parênteses
(w <- 2 + 5)
[1] 7

Tipos de variáveis

Conforme visto nos exemplos, o R trabalha com uma série de formatos de variáveis. Os principais são:

  • numeric: Valores numéricos. Pode ser do tipo

  • character: cadeia de caracteres

  • logical: valores lógicos

  • factor: variável categórica, com níveis definidos.

Podemos verificar o tipo de variável com o uso da função typeof(). Vamos verificar as variáveis anteriores

Tipos de variáveis

#Variável numérica
x
[1] 8.3
typeof(x)
[1] "double"
#Variável caractere
y
[1] "Isso é uma frase"
typeof(y)
[1] "character"
#Variável lógica
z
[1] TRUE
typeof(z)
[1] "logical"

Script

  • Conforme vimos, o R trabalha com funções e objetos por meio de comandos escritos;

  • Entretanto, muitas vezes é necessário estabelecer uma rotina de comandos;

  • Nesse caso, seria inviável a digitação consecutiva de uma série de comandos.

  • Para sanar esse problema, em R é possível escrever as instruções separadamente e executá-las quando necessário. O que permite essa prática são os Scripts.

  • Os Scripts nada mais são do que arquivos de texto que armazenam os códigos que serão executados.

Script

Os Scripts no RStudio são exibidos na janela Source. Para criar um novo script, existem três possibilidades:

  • Acessar o caminho File -> New File -> R Script

  • Clicar no ícone +, localizado abaixo da opção Filee selecionar R Script

  • Utilizar o atalho Ctrl + Shift + N.

  • As instruções que seriam executadas diretamente no console, podem ser digitadas no Script para serem executados a qualquer momento.

  • Podemos salvar nosso Script para futura utilização clicando no ícone de disquete.

  • Podemos abrir nosso Script clicando no ícone que apresenta uma pasta com uma seta verde.

  • Utilizaremos estes Scripts para resolução de exercícios, provas e trabalhos.

Script

  • Entretanto, o Script em si é apenas um conjunto de instruções. Diferente do console, ele não executa os comandos.

  • Para executar os comandos digitados no script, existem alguns caminhos:

    • Clicar na linha na qual o comando foi digitado e utilizar o atalho Ctrl + Enter.

    • Selecionar várias linhas de código e e utilizar o atalho Ctrl + Enter para executar múltiplos comandos.

  • A ideia do Script é organizar uma sequência de instruções, que será utilizada na análise de dados.

  • Para organizar melhor o Script, podemos utilizar comentários que descrevam os comandos.

  • Um comentário não será executado em nenhuma condição.

  • Podemos inserir comentários em nosso script usando o símbolo de #

  • Vamos ver agora um exemplo de Script, com as instruções anteriores.

Script

Exercício Prático 1

Para fixarmos o que foi visto até aqui, vamos fazer as seguintes atividades:

  • Crie um Script e realize nele as seguintes operações:

  • Atribua o valor 2.5 à variável x

  • Atribua o valor 1/4 à variável y

  • Some, subtraia, divida e multiplique x e y

  • Extraia a raiz de x e atribua ao objeto z

  • Verifique se a raiz de z é positiva

  • Atribua ao objeto nome seu nome completo

  • Verifique o tipo de variável do objeto nome

  • Salve o Script com o nome “Exemplo 1”

  • Feche e reabra o script.