Modelos Estatísticos - BICT/MAR - UNIFESP
Aula 1 - Apresentação do módulo; Introdução ao ambiente R, instalação
Cronograma
| DATAS | CONTEÚDO |
|---|---|
| 2023-03-15 | Apresentação do módulo; Introdução ao ambiente R, instalação |
| 2023-03-22 | Análise exploratória de dados (Parte I) |
| 2023-03-29 | Análise exploratória de dados (Parte II) |
| 2023-04-05 | Modelos lineares: regressão linear (Parte I) |
| 2023-04-12 | Modelos lineares: regressão linear (Parte II) |
| 2023-04-19 | Análise de Variância (Parte I) |
| 2023-04-26 | Análise de Variância (Parte II) |
| 2023-05-03 | 1° avaliação |
| 2023-05-10 | Modelos lineares Generalizados (Parte I) |
| 2023-05-17 | Modelos lineares Generalizados (Parte II) |
| 2023-05-24 | 2° avaliação |
| 2023-05-31 | Modelos não-lineares: função de potência |
| 2023-06-07 | Modelos não-lineares: regressão logistica |
| 2023-06-14 | Modelos não-lineares: modelo de Von Bertallanfy |
| 2023-06-21 | Modelos não-lineares: modelo de Ricker |
| 2023-06-28 | Revisão do conteúdo |
| 2023-07-05 | Avaliação final |
| 2023-07-12 | Revisão do conteúdo para exame |
Introdução
O R é um programa para análise estatística de livre distribuição e de código aberto. Isso significa que você pode baixar, instalar, repassar para seus amigos e até mesmo alterar o código fonte de acordo com suas necessidades. Ele pode ser instalado em diversas arquiteturas e sistemas operacionais diferentes, incluindo Windows, Linux, Macintosh e outros. Este guia está estruturado para instalação no Windows 64 bits
Instalação rápida
Passo 1
Entrar na página abaixo pelo link https://vps.fmvz.usp.br/CRAN/ . Após isso, clique no link indicado pela seta vermelha para que o Windows faça o download do arquivo “R-4.2.2-win.exe” e execute-o para que o R seja instalado no seu computador. Aparecerão várias janelas, mas fiquem atentos a janela “selecionar componentes” (veja abaixo). Caso o seu Windows seja da versão 64 bits (a grande maioria hoje é 64 bits), selecione apenas esta opção “64 bits”e desmarque a opção “32 bits”. Mantenha a caixa “Core Files” marcada e desmarque a caixa “message translations”.
Fazer download do arquivo na página do R
Passo 2
clique no link https://posit.co/download/rstudio-desktop/ para que o Windows faça o download do arquivo e execute-o para que o RStudio seja instalado no seu computador.
Importante! Instale nessa ordem: primeiro o R (passo 1) e só depois o RStudio (passo 2). O RStudio é apenas uma interface para o R, e por isso, precisa encontrar a instalação do R para poder ser instalado.
Feito isso, você já pode iniciar o RStudio (veja abaixo) e podemos começar as atividades do nosso módulo.
Fazer download do arquivo na página do R
Configuração inicial
Passo a passo para iniciar um trabalho com R:
Crie um diretório de trabalho (pode ser uma pasta dentro dos “meus documentos”) onde serão armazenados os dados, códigos R e saídas das análises que serão realizadas nesta pesquisa;
Utilizando o menu do RStudio, direcione o software para a pasta recentemente criada. Para isto, clique em Session >> Set Working Directory >> Choose Directory e direcione sua escolha para pasta criada anteriormente.
Para conferir o diretório que você está trabalhando, utilize a função do R “getwd()” (veja abaixo). No meu caso, eu criei uma pasta chamada “aula1_14_04” para trabalhar com todos arquivos, bem como salvar meus scripts e dados
Rstudio
Visão Geral - Entendendo o RStudio
Editor de scripts
O editor de scripts é utilizado para criar rotinas computacionais de análises. Este editor nos permite salvar cada passo realizado em nossa rotina de trabalho/análise, nos possibilitando não só revisitar este arquivo no futuro, como também, implementar a mesma rotina em momentos distintos. (REPRODUTIBILIDADE) Para acessar o editor de scripts do RStudio utilizemos os passos abaixo:
Abra um novo script para iniciar os trabalhos, para isto, navegue pelo menu do RStudio. Clicando em… File >> New File >> R Script
Por fim, salve o Script aberto na mesma pasta criada anteriormente, clicando em… File >> Save As… nomeie conforme desejado e salve o script com a extensão .R;
Rstudio
Operadores e Ordem de Prioridades
Alguns operadores e seus significados no R
# Adição
2 + 2
## [1] 4
# Multiplicação
5 * 2
## [1] 10
# Subtração
10 - 2
## [1] 8
# Divisão
12/3
## [1] 4
# Potenciação
2^2
## [1] 4
# Exponenciação
exp(2)
## [1] 7.389056
# Raiza quadrada
sqrt(4)
## [1] 2
# Fatorial
factorial(3)
## [1] 6
#logaritmos
log(3)
## [1] 1.098612Ordem de execução básica das operações no R - Ordem de prioridades
5 * 2 - 10 + 7
## [1] 7
5 * 2 - (10 + 7)
## [1] -7
5 * (2 - 10 + 7)
## [1] -5
5 * (2 - (10 + 7))
## [1] -75Funções e Argumentos
O R é constituído por inúmeros comandos (ou funções) agrupadas em pacotes específicos. Estes comandos são executados pelos seus respectivos nomes, seguidos de parênteses ( ). Cada função no R possui uma séries de argumentos que definem como cada comando será executado. Estes argumentos podem ser considerados as regras para aplicação de cada função. Deste modo, as funções ou comandos no R são estruturadas da seguinte maneira:
nome(argumento1, argumento2, …)
Exemplo: função “runif()” utilizada para gerar números aleatórios de uma distribuição uniforme. Esta função possui 3 argumentos básicos:
• argumento “n” - número de elementos que queremos gerar;
• argumento “min” - limite mínimo para a distribuição dos números;
• argumento “max” - limite máximo para a distribuição dos números.
runif(n, min = 0, max = 1)
# Gerando 10 números aleatórios entre 0 e 100
runif(n = 10, min = 1, max = 100)
## [1] 31.912429 32.578564 7.530488 72.311614 33.484946 77.933779 64.722863
## [8] 88.264880 15.423873 59.121355Algumas funções do R já possuem argumentos pré-definidos. Utilizando o caso da função “runif()”, podemos notar que os argumentos min e max deste comando já possuem valores definidos por padrão (default). Exemplo: no caso da função “runif()” basta setarmos um valor para o argumento n, que o R já nos retorna uma lista de números aleatórios.
# Gerando 20 números aleatórios
runif(20)
## [1] 0.167284212 0.423432367 0.004961097 0.761131593 0.656892418 0.223470194
## [7] 0.822950488 0.982161190 0.706932034 0.366294477 0.976509422 0.788443004
## [13] 0.680967919 0.633045078 0.090131364 0.686367769 0.583589895 0.559109161
## [19] 0.563185950 0.167560873Usando a função help
Pergunta: Quais são os valores dos argumentos min e max no caso do segundo exemplo? Como posso verificar os argumentos que tem valores pré-definidos?
• Uma forma é utilizar a função “args()” para conhecer os argumentos existentes em comandos específicos;
• Outra maneira é utilizar a função “help()” e pesquisar toda a estrutura da função que se deseja utilizar.
# Utilizando a função args()
args(runif)
## function (n, min = 0, max = 1)
## NULL
# Utilizando a função help()
help(runif)
## starting httpd help server ... done