Modelos Estatísticos - BICT/MAR - UNIFESP

Aula 1 - Apresentação do módulo; Introdução ao ambiente R, instalação

Cronograma

Data Conteúdo
2024-03-06 Apresentação do módulo; Introdução ao ambiente R, instalação
2024-03-13 Análise exploratória de dados (Parte I)
2024-03-20 Análise exploratória de dados (Parte II)
2024-03-27 Modelos lineares: regressão linear (Parte I)
2024-04-03 Modelos lineares: regressão linear (Parte II)
2024-04-10 Análise de Variância (Parte I)
2024-04-17 Análise de Variância (Parte II)
2024-04-24 1° avaliação
2024-05-01 Modelos lineares Generalizados (Parte I)
2024-05-08 Modelos lineares Generalizados (Parte II)
2024-05-15 2° avaliação
2024-05-22 Modelos não-lineares: função de potência
2024-05-29 Modelos não-lineares: regressão logistica
2024-06-05 Modelos não-lineares: modelo de Von Bertallanfy
2024-06-12 Avaliação final
2024-06-19 NA
2024-06-26 Exame
2024-07-03 NA

Introdução

O R é um programa para análise estatística de livre distribuição e de código aberto. Isso significa que você pode baixar, instalar, repassar para seus amigos e até mesmo alterar o código fonte de acordo com suas necessidades. Ele pode ser instalado em diversas arquiteturas e sistemas operacionais diferentes, incluindo Windows, Linux, Macintosh e outros. Este guia está estruturado para instalação no Windows 64 bits

Instalação rápida

Passo 1

Entrar na página abaixo pelo link https://vps.fmvz.usp.br/CRAN/ . Após isso, clique no link indicado pela seta vermelha para que o Windows faça o download do arquivo “R-4.2.2-win.exe” e execute-o para que o R seja instalado no seu computador. Aparecerão várias janelas, mas fiquem atentos a janela “selecionar componentes” (veja abaixo). Caso o seu Windows seja da versão 64 bits (a grande maioria hoje é 64 bits), selecione apenas esta opção “64 bits”e desmarque a opção “32 bits”. Mantenha a caixa “Core Files” marcada e desmarque a caixa “message translations”.

Fazer download do arquivo na página do R
Fazer download do arquivo na página do R

Passo 2

clique no link https://posit.co/download/rstudio-desktop/ para que o Windows faça o download do arquivo e execute-o para que o RStudio seja instalado no seu computador.

Importante! Instale nessa ordem: primeiro o R (passo 1) e só depois o RStudio (passo 2). O RStudio é apenas uma interface para o R, e por isso, precisa encontrar a instalação do R para poder ser instalado.

Feito isso, você já pode iniciar o RStudio (veja abaixo) e podemos começar as atividades do nosso módulo.

Fazer download do arquivo na página do R
Fazer download do arquivo na página do R

Configuração inicial

Passo a passo para iniciar um trabalho com R:

  1. Crie um diretório de trabalho (pode ser uma pasta dentro dos “meus documentos”) onde serão armazenados os dados, códigos R e saídas das análises que serão realizadas nesta pesquisa;

  2. Utilizando o menu do RStudio, direcione o software para a pasta recentemente criada. Para isto, clique em Session >> Set Working Directory >> Choose Directory e direcione sua escolha para pasta criada anteriormente.

  3. Para conferir o diretório que você está trabalhando, utilize a função do R “getwd()” (veja abaixo). No meu caso, eu criei uma pasta chamada “aula1_14_04” para trabalhar com todos arquivos, bem como salvar meus scripts e dados

Rstudio
Rstudio

Visão Geral - Entendendo o RStudio

Editor de scripts

O editor de scripts é utilizado para criar rotinas computacionais de análises. Este editor nos permite salvar cada passo realizado em nossa rotina de trabalho/análise, nos possibilitando não só revisitar este arquivo no futuro, como também, implementar a mesma rotina em momentos distintos. (REPRODUTIBILIDADE) Para acessar o editor de scripts do RStudio utilizemos os passos abaixo:

  1. Abra um novo script para iniciar os trabalhos, para isto, navegue pelo menu do RStudio. Clicando em… File >> New File >> R Script

  2. Por fim, salve o Script aberto na mesma pasta criada anteriormente, clicando em… File >> Save As… nomeie conforme desejado e salve o script com a extensão .R;

Rstudio
Rstudio

Operadores e Ordem de Prioridades

Alguns operadores e seus significados no R


# Adição
2 + 2
## [1] 4

# Multiplicação
5 * 2 
## [1] 10

# Subtração
10 - 2
## [1] 8

# Divisão
12/3
## [1] 4

# Potenciação
2^2
## [1] 4

# Exponenciação
exp(2)
## [1] 7.389056

# Raiza quadrada
sqrt(4)
## [1] 2

# Fatorial
factorial(3)
## [1] 6

#logaritmos
log(3)
## [1] 1.098612

Ordem de execução básica das operações no R - Ordem de prioridades

5 * 2 - 10 + 7
## [1] 7

5 * 2 - (10 + 7)
## [1] -7

5 * (2 - 10 + 7)
## [1] -5

5 * (2 - (10 + 7))
## [1] -75

Funções e Argumentos

O R é constituído por inúmeros comandos (ou funções) agrupadas em pacotes específicos. Estes comandos são executados pelos seus respectivos nomes, seguidos de parênteses ( ). Cada função no R possui uma séries de argumentos que definem como cada comando será executado. Estes argumentos podem ser considerados as regras para aplicação de cada função. Deste modo, as funções ou comandos no R são estruturadas da seguinte maneira:

nome(argumento1, argumento2, …)

Exemplo: função “runif()” utilizada para gerar números aleatórios de uma distribuição uniforme. Esta função possui 3 argumentos básicos:

• argumento “n” - número de elementos que queremos gerar;

• argumento “min” - limite mínimo para a distribuição dos números;

• argumento “max” - limite máximo para a distribuição dos números.

runif(n, min = 0, max = 1)

# Gerando 10 números aleatórios entre 0 e 100
runif(n = 10, min = 1, max = 100)
##  [1]  2.158944 27.486101 42.679412 90.025197 34.635626 84.433083 96.886353
##  [8] 63.158651 67.203726 90.248083

Algumas funções do R já possuem argumentos pré-definidos. Utilizando o caso da função “runif()”, podemos notar que os argumentos min e max deste comando já possuem valores definidos por padrão (default). Exemplo: no caso da função “runif()” basta setarmos um valor para o argumento n, que o R já nos retorna uma lista de números aleatórios.

# Gerando 20 números aleatórios
runif(20)
##  [1] 0.85513042 0.67687535 0.71414906 0.26507121 0.64875167 0.13045495
##  [7] 0.46783028 0.12580531 0.35258102 0.90476369 0.06072912 0.86925112
## [13] 0.81100477 0.06670167 0.10550623 0.91176797 0.85046203 0.96470843
## [19] 0.63582693 0.68521038

Usando a função help

Pergunta: Quais são os valores dos argumentos min e max no caso do segundo exemplo? Como posso verificar os argumentos que tem valores pré-definidos?

• Uma forma é utilizar a função “args()” para conhecer os argumentos existentes em comandos específicos;

• Outra maneira é utilizar a função “help()” e pesquisar toda a estrutura da função que se deseja utilizar.

Tipo Descrição
character Texto ou caracter
numeric Números inteiros ou reais
logical Booleano ou Verdadeiro/Falso (TRUE/FALSE)
complex Números complexos
date Datas
factor Texto ou caracter estruturado em níveis

# Utilizando a função args()
args(runif)
## function (n, min = 0, max = 1) 
## NULL

# Utilizando a função help()
help(runif)
## starting httpd help server ... done