Modelos Estatísticos - BICT/MAR - UNIFESP

Aula 1 - Apresentação do módulo; Introdução ao ambiente R, instalação

Cronograma

DATAS CONTEÚDO
2023-03-15 Apresentação do módulo; Introdução ao ambiente R, instalação
2023-03-22 Análise exploratória de dados (Parte I)
2023-03-29 Análise exploratória de dados (Parte II)
2023-04-05 Modelos lineares: regressão linear (Parte I)
2023-04-12 Modelos lineares: regressão linear (Parte II)
2023-04-19 Análise de Variância (Parte I)
2023-04-26 Análise de Variância (Parte II)
2023-05-03 1° avaliação
2023-05-10 Modelos lineares Generalizados (Parte I)
2023-05-17 Modelos lineares Generalizados (Parte II)
2023-05-24 2° avaliação
2023-05-31 Modelos não-lineares: função de potência
2023-06-07 Modelos não-lineares: regressão logistica
2023-06-14 Modelos não-lineares: modelo de Von Bertallanfy
2023-06-21 Modelos não-lineares: modelo de Ricker
2023-06-28 Revisão do conteúdo
2023-07-05 Avaliação final
2023-07-12 Revisão do conteúdo para exame

Introdução

O R é um programa para análise estatística de livre distribuição e de código aberto. Isso significa que você pode baixar, instalar, repassar para seus amigos e até mesmo alterar o código fonte de acordo com suas necessidades. Ele pode ser instalado em diversas arquiteturas e sistemas operacionais diferentes, incluindo Windows, Linux, Macintosh e outros. Este guia está estruturado para instalação no Windows 64 bits

Instalação rápida

Passo 1

Entrar na página abaixo pelo link https://vps.fmvz.usp.br/CRAN/ . Após isso, clique no link indicado pela seta vermelha para que o Windows faça o download do arquivo “R-4.2.2-win.exe” e execute-o para que o R seja instalado no seu computador. Aparecerão várias janelas, mas fiquem atentos a janela “selecionar componentes” (veja abaixo). Caso o seu Windows seja da versão 64 bits (a grande maioria hoje é 64 bits), selecione apenas esta opção “64 bits”e desmarque a opção “32 bits”. Mantenha a caixa “Core Files” marcada e desmarque a caixa “message translations”.

Fazer download do arquivo na página do R

Passo 2

clique no link https://posit.co/download/rstudio-desktop/ para que o Windows faça o download do arquivo e execute-o para que o RStudio seja instalado no seu computador.

Importante! Instale nessa ordem: primeiro o R (passo 1) e só depois o RStudio (passo 2). O RStudio é apenas uma interface para o R, e por isso, precisa encontrar a instalação do R para poder ser instalado.

Feito isso, você já pode iniciar o RStudio (veja abaixo) e podemos começar as atividades do nosso módulo.

Fazer download do arquivo na página do R

Configuração inicial

Passo a passo para iniciar um trabalho com R:

  1. Crie um diretório de trabalho (pode ser uma pasta dentro dos “meus documentos”) onde serão armazenados os dados, códigos R e saídas das análises que serão realizadas nesta pesquisa;

  2. Utilizando o menu do RStudio, direcione o software para a pasta recentemente criada. Para isto, clique em Session >> Set Working Directory >> Choose Directory e direcione sua escolha para pasta criada anteriormente.

  3. Para conferir o diretório que você está trabalhando, utilize a função do R “getwd()” (veja abaixo). No meu caso, eu criei uma pasta chamada “aula1_14_04” para trabalhar com todos arquivos, bem como salvar meus scripts e dados

Rstudio

Visão Geral - Entendendo o RStudio

Editor de scripts

O editor de scripts é utilizado para criar rotinas computacionais de análises. Este editor nos permite salvar cada passo realizado em nossa rotina de trabalho/análise, nos possibilitando não só revisitar este arquivo no futuro, como também, implementar a mesma rotina em momentos distintos. (REPRODUTIBILIDADE) Para acessar o editor de scripts do RStudio utilizemos os passos abaixo:

  1. Abra um novo script para iniciar os trabalhos, para isto, navegue pelo menu do RStudio. Clicando em… File >> New File >> R Script

  2. Por fim, salve o Script aberto na mesma pasta criada anteriormente, clicando em… File >> Save As… nomeie conforme desejado e salve o script com a extensão .R;

Rstudio

Operadores e Ordem de Prioridades

Alguns operadores e seus significados no R


# Adição
2 + 2
## [1] 4

# Multiplicação
5 * 2 
## [1] 10

# Subtração
10 - 2
## [1] 8

# Divisão
12/3
## [1] 4

# Potenciação
2^2
## [1] 4

# Exponenciação
exp(2)
## [1] 7.389056

# Raiza quadrada
sqrt(4)
## [1] 2

# Fatorial
factorial(3)
## [1] 6

#logaritmos
log(3)
## [1] 1.098612

Ordem de execução básica das operações no R - Ordem de prioridades

5 * 2 - 10 + 7
## [1] 7

5 * 2 - (10 + 7)
## [1] -7

5 * (2 - 10 + 7)
## [1] -5

5 * (2 - (10 + 7))
## [1] -75

Funções e Argumentos

O R é constituído por inúmeros comandos (ou funções) agrupadas em pacotes específicos. Estes comandos são executados pelos seus respectivos nomes, seguidos de parênteses ( ). Cada função no R possui uma séries de argumentos que definem como cada comando será executado. Estes argumentos podem ser considerados as regras para aplicação de cada função. Deste modo, as funções ou comandos no R são estruturadas da seguinte maneira:

nome(argumento1, argumento2, …)

Exemplo: função “runif()” utilizada para gerar números aleatórios de uma distribuição uniforme. Esta função possui 3 argumentos básicos:

• argumento “n” - número de elementos que queremos gerar;

• argumento “min” - limite mínimo para a distribuição dos números;

• argumento “max” - limite máximo para a distribuição dos números.

runif(n, min = 0, max = 1)

# Gerando 10 números aleatórios entre 0 e 100
runif(n = 10, min = 1, max = 100)
##  [1] 31.912429 32.578564  7.530488 72.311614 33.484946 77.933779 64.722863
##  [8] 88.264880 15.423873 59.121355

Algumas funções do R já possuem argumentos pré-definidos. Utilizando o caso da função “runif()”, podemos notar que os argumentos min e max deste comando já possuem valores definidos por padrão (default). Exemplo: no caso da função “runif()” basta setarmos um valor para o argumento n, que o R já nos retorna uma lista de números aleatórios.

# Gerando 20 números aleatórios
runif(20)
##  [1] 0.167284212 0.423432367 0.004961097 0.761131593 0.656892418 0.223470194
##  [7] 0.822950488 0.982161190 0.706932034 0.366294477 0.976509422 0.788443004
## [13] 0.680967919 0.633045078 0.090131364 0.686367769 0.583589895 0.559109161
## [19] 0.563185950 0.167560873

Usando a função help

Pergunta: Quais são os valores dos argumentos min e max no caso do segundo exemplo? Como posso verificar os argumentos que tem valores pré-definidos?

• Uma forma é utilizar a função “args()” para conhecer os argumentos existentes em comandos específicos;

• Outra maneira é utilizar a função “help()” e pesquisar toda a estrutura da função que se deseja utilizar.

# Utilizando a função args()
args(runif)
## function (n, min = 0, max = 1) 
## NULL

# Utilizando a função help()
help(runif)
## starting httpd help server ... done