boas práticas de trabalho em R

  1. manter cada projeto de R em uma única pasta de trabalho ✔

  2. usar sempre scripts e comentar muito o código (#) ✔

  3. criar um arquivo de metadados (README)

  4. ter uma estrutura de pastas e subpastas que permita organizar a informação adequadamente, separando dados originais, outputs e documentação (./data,./outputs, ./figs e ./docs, por exemplo)

  5. usar caminhos relativos (relative pathways) para ler os dados dentro dessa estrutura de pastas. (aqui . ou nada, subpastas: ./subpastas)

https://github.com/Projeto-BHRD-INMA/boas_praticas

configurar RStudio com base nessas boas práticas

“não salve o workspace”

codificação

a codificação pode gerar erros entre sistemas operativos, em particular com caracteres especiais. UTF-8 é um padrão bem reconhecido entre plataformas.

terminal

o terminal de git vai dar menos problemas porque windows é diferente de mac e linux


projetos de análise em R

projetos de RStudio

novo projeto > diretório existente > pasta > OK

  • novo arquivo com extensão .Rproj

um projeto, um .Rproj, uma pasta

primeiro script no projeto

  • Arquivo > Novo arquivo > Script
  • getwd()
  • Ctrl+ Enter
  • getwd() significa Get working directory -> igual a pwd no terminal
getwd()
  • salve o script na subpasta /R

estrutura de um projeto de análise de dados

project/
    ├── data/
    ├── docs/
    ├── figs/
    ├── R/
    ├── output/
    └── README.md

criação da estrutura de pastas do projeto usando o terminal

Vamos usar o terminal do RStudio mas isto pode ser feito em qualquer terminal de mac ou linux, ou criando uma sessão de terminal de git em windows (click direito em qualquer pasta de windows, opção new git bash)

  • bash é a linguagem básica do computador, para usar no terminal
  • altamente poderosa - ela está por trás de toda operação sobre os arquivos em qualquer sistema operacional (em windows não por defeito)
  • altamente conservada :D outras línguas usam comandos similares

alguns comandos muito básicos

+ `pwd`: print working directory
+ `ls`: list 
+ `cd`: change directory
+ `mkdir`: make directory
+ `touch`: cria arquivo ex. `touch README.md`
+ `rm`: remove
+ `mv`: renomeia e move
+ `cp`: copia
+ `rm`: apaga
  • Abra RStudio
  • Abra o terminal de RStudio: Tools > Terminal > New terminal
  • Execute pwd: qual é a pasta padrão onde R acha que você está trabalhando?

pwd = print working directory

  • Decida onde você vai querer criar seu projeto

Criando a pasta de trabalho

Vamos imaginar que a pasta 2_data_analysis está vazia, e portanto o comando ls não retorna nada.

Para criar uma pasta nova desde o terminal, utiliza-se o comando mkdir (“make directory”): mkdir curso

O comando ls vai retornar a pasta recém criada.

Criando subpastas

  • Navegue até dentro da nova pasta e crie as seguintes subpastas: data, R, docs, output, figs

A pasta do projeto deveria ter a estrutura seguinte:

projeto/
    ├── data/
    ├── docs/
    ├── figs/
    ├── R/
    └── output/

Ela pode ser inspeccionada digitando ls, no explorador de arquivos do seu computador ou na aba “Files” do RStudio.

Criando o README

O último comando inicial importante é a criação do arquivo README na pasta do projeto, para isto é usado o comando touch.

A criação de um arquivo sem extensão é possível, ex. touch README, mas o computador não vai saber com qual programa abrir. Outra opção seria a extensão .txt para abrir no bloco de notas. Afinal a extensão de um arquivo é apenas um jeito de indicar o computador com qual programa o arquivo deve ser aberto, e vários formatos de texto podem ter as extensões trocadas.

Aqui vamos usar markdown, um formato de texto que pode ser interpretado em várias plataformas. A extensão para arquivos markdown é .md, portanto o comando vai ser touch README.md

O comando ls deve agora refletir a criação deste arquivo:

project/
    ├── data/
    ├── docs/
    ├── figs/
    ├── R/
    ├── output/
    └── README.md

Ao fazer click desde dentro do RStudio, ele abre o README.md e este pode ser editado facilmente.

hoje: se conectar às máquinas azure

Primeira vez

  • Antes de entrar: pega a chave ssh.
  • ssh-add rstudio_key.pem -> adiciona a chave ssh para poder se conectar
  • Entra no portal
  • Liga a máquina
  • Pede acesso #new!
  • Pega o endereço ip da máquina [ip]
  • Vai pro terminal e se conecta à máquina: ssh jbrj@[ip]
  • Navega e executa tudo livremente

As seguintes vezes

  • Não precisa voltar a adicionar a chave
  • Entra no portal
  • Liga a máquina
  • Pede acesso #new!
  • Pega o endereço ip da máquina [ip]

Para entrar ao RStudio server

  • Entra no portal
  • Liga a máquina
  • Pede acesso #new!
  • Pega o endereço ip da máquina [ip]
  • entra no navegador: [ip]:8787 usuário jbrj, senha