Modelos Estatísticos - BICT/MAR - UNIFESP
Aula 1 - Apresentação do módulo; Introdução ao ambiente R, instalação
Cronograma
| Data | Conteúdo |
|---|---|
| 2024-03-06 | Apresentação do módulo; Introdução ao ambiente R, instalação |
| 2024-03-13 | Análise exploratória de dados (Parte I) |
| 2024-03-20 | Análise exploratória de dados (Parte II) |
| 2024-03-27 | Modelos lineares: regressão linear (Parte I) |
| 2024-04-03 | Modelos lineares: regressão linear (Parte II) |
| 2024-04-10 | Análise de Variância (Parte I) |
| 2024-04-17 | Análise de Variância (Parte II) |
| 2024-04-24 | 1° avaliação |
| 2024-05-01 | Modelos lineares Generalizados (Parte I) |
| 2024-05-08 | Modelos lineares Generalizados (Parte II) |
| 2024-05-15 | 2° avaliação |
| 2024-05-22 | Modelos não-lineares: função de potência |
| 2024-05-29 | Modelos não-lineares: regressão logistica |
| 2024-06-05 | Modelos não-lineares: modelo de Von Bertallanfy |
| 2024-06-12 | Avaliação final |
| 2024-06-19 | NA |
| 2024-06-26 | Exame |
| 2024-07-03 | NA |
Introdução
O R é um programa para análise estatística de livre distribuição e de código aberto. Isso significa que você pode baixar, instalar, repassar para seus amigos e até mesmo alterar o código fonte de acordo com suas necessidades. Ele pode ser instalado em diversas arquiteturas e sistemas operacionais diferentes, incluindo Windows, Linux, Macintosh e outros. Este guia está estruturado para instalação no Windows 64 bits
Instalação rápida
Passo 1
Entrar na página abaixo pelo link https://vps.fmvz.usp.br/CRAN/ . Após isso, clique no link indicado pela seta vermelha para que o Windows faça o download do arquivo “R-4.2.2-win.exe” e execute-o para que o R seja instalado no seu computador. Aparecerão várias janelas, mas fiquem atentos a janela “selecionar componentes” (veja abaixo). Caso o seu Windows seja da versão 64 bits (a grande maioria hoje é 64 bits), selecione apenas esta opção “64 bits”e desmarque a opção “32 bits”. Mantenha a caixa “Core Files” marcada e desmarque a caixa “message translations”.
Passo 2
clique no link https://posit.co/download/rstudio-desktop/ para que o Windows faça o download do arquivo e execute-o para que o RStudio seja instalado no seu computador.
Importante! Instale nessa ordem: primeiro o R (passo 1) e só depois o RStudio (passo 2). O RStudio é apenas uma interface para o R, e por isso, precisa encontrar a instalação do R para poder ser instalado.
Feito isso, você já pode iniciar o RStudio (veja abaixo) e podemos começar as atividades do nosso módulo.
Configuração inicial
Passo a passo para iniciar um trabalho com R:
Crie um diretório de trabalho (pode ser uma pasta dentro dos “meus documentos”) onde serão armazenados os dados, códigos R e saídas das análises que serão realizadas nesta pesquisa;
Utilizando o menu do RStudio, direcione o software para a pasta recentemente criada. Para isto, clique em Session >> Set Working Directory >> Choose Directory e direcione sua escolha para pasta criada anteriormente.
Para conferir o diretório que você está trabalhando, utilize a função do R “getwd()” (veja abaixo). No meu caso, eu criei uma pasta chamada “aula1_14_04” para trabalhar com todos arquivos, bem como salvar meus scripts e dados
Visão Geral - Entendendo o RStudio
Editor de scripts
O editor de scripts é utilizado para criar rotinas computacionais de análises. Este editor nos permite salvar cada passo realizado em nossa rotina de trabalho/análise, nos possibilitando não só revisitar este arquivo no futuro, como também, implementar a mesma rotina em momentos distintos. (REPRODUTIBILIDADE) Para acessar o editor de scripts do RStudio utilizemos os passos abaixo:
Abra um novo script para iniciar os trabalhos, para isto, navegue pelo menu do RStudio. Clicando em… File >> New File >> R Script
Por fim, salve o Script aberto na mesma pasta criada anteriormente, clicando em… File >> Save As… nomeie conforme desejado e salve o script com a extensão .R;
Operadores e Ordem de Prioridades
Alguns operadores e seus significados no R
Funções e Argumentos
O R é constituído por inúmeros comandos (ou funções) agrupadas em pacotes específicos. Estes comandos são executados pelos seus respectivos nomes, seguidos de parênteses ( ). Cada função no R possui uma séries de argumentos que definem como cada comando será executado. Estes argumentos podem ser considerados as regras para aplicação de cada função. Deste modo, as funções ou comandos no R são estruturadas da seguinte maneira:
nome(argumento1, argumento2, …)
Exemplo: função “runif()” utilizada para gerar números aleatórios de uma distribuição uniforme. Esta função possui 3 argumentos básicos:
• argumento “n” - número de elementos que queremos gerar;
• argumento “min” - limite mínimo para a distribuição dos números;
• argumento “max” - limite máximo para a distribuição dos números.
runif(n, min = 0, max = 1)
# Gerando 10 números aleatórios entre 0 e 100
runif(n = 10, min = 1, max = 100)
## [1] 21.42316 83.86546 45.49108 84.38554 67.71937 83.56762 54.66239 66.84094
## [9] 31.19377 89.57450Algumas funções do R já possuem argumentos pré-definidos. Utilizando o caso da função “runif()”, podemos notar que os argumentos min e max deste comando já possuem valores definidos por padrão (default). Exemplo: no caso da função “runif()” basta setarmos um valor para o argumento n, que o R já nos retorna uma lista de números aleatórios.
Usando a função help
Pergunta: Quais são os valores dos argumentos min e max no caso do segundo exemplo? Como posso verificar os argumentos que tem valores pré-definidos?
• Uma forma é utilizar a função “args()” para conhecer os argumentos existentes em comandos específicos;
• Outra maneira é utilizar a função “help()” e pesquisar toda a estrutura da função que se deseja utilizar.