This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

License: CC BY-SA 4.0

License: CC BY-SA 4.0

1 Apêndice: Passos básicos para o R e RStudio

Nesta seção faz-se uma breve sugestão de como instalar o R e o RStudio a fim de permitir seu uso nas rotinas do livro.

1.1 Instalação

Rstudio é um ambiente de desenvolvimento integrado (IDE) para a linguagem de programação R. Ou de um modo mais simples, é um software que permitirá rodar o R de um modo um pouco mais amigável. É possível obter o R e o RStudio de modo livre, para uso não comercial, e recordando as devidas permissões ou licenças autorais. Para mais detalhes sobre as licenças tipo Creative Commons, acessar https://creativecommons.org/licenses/?lang=pt_BR.

Os passos básicos são: 1. Instalar o R; 2. Instalar o RStudio; e, 3. Instalar os pacotes necessários (que pode ser sob demanda).

Para iniciar, instale o R, que pode ser obtido gratuitamente no site (para ambiente MS Windows) http://cran.r-project.org/bin/windows/base/. Uma tela deve abrir em seu navegador, clique em download R x.xx for Windows e siga as instruções, por exemplo, para escolher o idioma desejado.

Figura A.1 Tela de download do R para Windows).

Figura A.1 Tela de download do R para Windows).

O processo de instalação do R em geral ocorre em um diretório paralelo a uma eventual versão anterior. Sugere-se preservar a versão “estável” até ter a certeza de que a nova versão é a melhor. Embora o não uso da última versão possa gerar “avisos” (warnings) ao rodar scripts, na maior parte dos casos isso não impede que as funções do R funcionem. Após a instalação, se abrir o R (clicando sobre o ícone na tela de trabalho, referente ao arquivo executável RGui.exe), deve aparecer uma tela semelhante a figura A2.

Figura A.2 Tela de abertura do R para Windows).

Figura A.2 Tela de abertura do R para Windows).

A seguir, instale o RStudio a partir de https://www.rstudio.com/. Clique em Download RStudio, e depois escolha a versão desejada. Existem versões comerciais e/ou que conferem algumas opções de suporte (e requerem pagamentos) ou a versão livre, free, que pode ser para o desktop ou para um servidor (server). Sugere-se a versão desktop clicando em RStudio Desktop Free. https://www.rstudio.com/products/rstudio/download/#download. Escolha a plataforma adequada ao seu sistema operacional.

Figura A.3 Tela de download do RStudio Desktop Free).

Figura A.3 Tela de download do RStudio Desktop Free).

Figura A.4 Tela de escolha do sistema operacional do RStudio Desktop Free).

Figura A.4 Tela de escolha do sistema operacional do RStudio Desktop Free).

Instalados os softwares R e RStudio, deve-se escolher o repositório dos pacotes de modo a permitir acessar os arquivos necessários para cada rotina.

A tela inicial do RStudio funciona em geral no modo de quadrantes, ou janelas de visualização (Figura A.5.)

Figura A.5 Tela do RStudio).

Figura A.5 Tela do RStudio).

É possível ver uma tela do Console, onde serão colocados os comandos, ou a tela de execução dos comandos e funções. Outra tela consta o ambiente (Environment) onde serão apresentados os objetos e funções carregadas na memória do sistema. Há ainda o quadrante da visualização dos arquivos do diretório de trabalho (Files), gráficos (Plots), pacotes (Packages), o Help e o visualizador (Viewer).

Um passo importante é a escolha do repositório padrão a trabalhar, é a escolha do local onde serão obtidos os pacotes. No Brasil, encontram-se repositórios nos estados de São Paulo, Rio de Janeiro e Paraná. O RStudio possui o repositorio próprio, mas o R permite a escolha do repositorio entrando no R, na aba Arquivo/Escolher espelho CRAN.

Figura A.6 Tela do R - escolha do Espelho CRAN).

Figura A.6 Tela do R - escolha do Espelho CRAN).

Figura A.7 Tela do R - CRAN mirror).

Figura A.7 Tela do R - CRAN mirror).

No RStudio, a definição do espelho (mirror) CRAN é um pouco diferente. Deve-se acessar o RStudio no menu Tools e depois Global options e abrirá uma janela onde deve-se procurar por Packages, conforme a figura A.8.

Figura A.8 RStudio: Definição do Espelho - CRAN mirror).

Figura A.8 RStudio: Definição do Espelho - CRAN mirror).

Feito isso, acessar o botão Change e escolher o espelho desejado, como na figura A.9.

Figura A.9 RStudio: Escolha do Espelho - CRAN mirror).

Figura A.9 RStudio: Escolha do Espelho - CRAN mirror).

1.2 Iniciando um projeto

Recomenda-se trabalhar sempre com um projeto novo, específico para o que se pretende estudar. Desse modo, concentram-se os scripts, dados e outros arquivos no mesmo diretório de trabalho, o do projeto criado. Abre-se a aba File\New Project no RStudio.

Figura A.10 RStudio - Novo projeto).

Figura A.10 RStudio - Novo projeto).

Na sequência, deve-se escolher entre um novo diretório ou um diretório existente, o tipo de projeto (se um projeto vazio - empty - ou pacote R ou aplicativos Shiny), e depois especifica o nome do novo diretório e define a pasta onde será criado o novo projeto e novo diretório. U arquivo com o mesmo nome do projeto e com extensão .Rproj será criado e os arquivos deste diretório serão visualizados na aba Files do RStudio.

Figura A.11 RStudio - Novo projeto e diretório de trabalho).

Figura A.11 RStudio - Novo projeto e diretório de trabalho).

É possível visualizar um exemplo na Figura A.12, onde na aba de arquivos, pacotes, plots e ajuda tem-se o arquivo com a extensão .Rproj menciobado anteriormente.

Figura A.12 RStudio - Diretório de trabalho).

Figura A.12 RStudio - Diretório de trabalho).

A seguir, para iniciar os trabalhos, recomenda-se colocar o arquivo de dados (planilha MS Excel ou arquivo de texto - txt,csv - ou de outro formato como o arquivo de dados do R - .Rda) nesta mesma pasta do diretório de trabalho. Sugere-se fazer isso por meio do Explorador de arquivos do Windows. Feito isso, o arquivo de dados aparecerá na janela Files, Figura A.13.

Figura A.13 RStudio - arquivo de dados).

Figura A.13 RStudio - arquivo de dados).

O próximo passo é pegar algum script para exemplo do que pretende e começar a adaptar as rotinas para o seu próprio estudo. Lembrar de que, em alguns casos, pode ser necessário citar e referenciar adequadamente de onde retirou o script para adaptar. Em outros, o script é livre e apenas deverá referenciar os pacotes utilizados. O script é o arquivo com extensão .R. Ele terá as linhas de comentários quando antecedidas pelo símbolo #. O arquivo de sessão será armazenado com extensão .RData.

1.3 Organizando os pacotes

Uma forma útil é organizar o local onde ficam seus pacotes. Para checar onde estão seus pacotes, executa-se o comando .libPaths(). Seguindo a orientação de https://statistics.berkeley.edu/computing/R-packages, ou ainda https://www.accelebrate.com/library/how-to-articles/r-rstudio-library, existem formas de você baixar os pacotes em seu computador. Isto facilita para manusear os pacotes quando desejar fazer cópias de segurança entre outras atividades de manutenção do seu R/RStudio. Uma das vantagens de ter o pacote localmente, em seu microcomputador, é para ter maior velocidade de execução sem necessidade de estar online, desde que o arquivo tenha sido previamente instalado ou baixado do espelho CRAN.

1.3.1 Alterando temporariamente o caminho da biblioteca

Você pode modificar a noção de R do seu caminho de biblioteca de uma só vez, especificando o argumento lib= para install.packages. Suponha que haja um diretório chamado MyRlibs em seu diretório inicial. O comando:

install.packages('caTools',lib='~/MyRlibs')

instalará o pacote especificado em seu diretório local. Para acessá-lo, o argumento lib.loc= de library deve ser usado:

library('caTools',lib='~/MyRlibs')

Um problema com esse esquema é que, se uma biblioteca local invocar a função library(), ela não saberá também pesquisar a biblioteca local.

1.3.2 Alterando o caminho da biblioteca para uma sessão

A função .libPaths() aceita um vetor de caracteres que nomeia as bibliotecas que devem ser usadas como um caminho de pesquisa. Observe que ele não retém automaticamente os diretórios que já estão no caminho de pesquisa. Como a função .libPaths() retorna o caminho de busca atual quando chamado sem argumentos, uma chamada como

.libPaths(c('~/MyRlibs',.libPaths()))

colocará o seu diretório local no início do caminho de busca. Isso significa que pelo install.packages(), os pacotes serão colocados automaticamente nesse local, e a função library() encontrará bibliotecas em seu diretório local sem argumentos adicionais. Portanto, essa será a minha escolha pessoal:

.libPaths("C:/MY_R_LIBS")
# ao especificar o diretório na linha anterior, 
# o comando da linha a seguir mostrará os diretórios locais.
.libPaths()
## [1] "C:/MY_R_LIBS"                      
## [2] "C:/Program Files/R/R-3.6.1/library"

Outra alternativa, segundo https://www.accelebrate.com/library/how-to-articles/r-rstudio-library. Primeiro crie o diretório C:/MyRlibs. Pode fazê-lo por meio do Windows Explorer. Depois, executar os seguintes comandos em seu console:

myPaths <- .libPaths()
myPaths <- c(myPaths, 'C:/MyRlibs')
.libPaths(myPaths) # adiciona novo caminho
.libPaths()
## [1] "C:/MY_R_LIBS"                      
## [2] "C:/Program Files/R/R-3.6.1/library"
## [3] "C:/MyRlibs"

Assim, estamos direcionando para C:/MyRlibs (observar a necessidade de inverter a barra para o RStudio compreender perfeitamente).

Uma vez encerrada a sessão, o R desfaz a alteração do diretório e se perde a mudança realizada, retornando ao diretório default (padrão).

1.3.3 Modificando permanentemente o caminho da biblioteca

A variável de ambiente R_LIBS é definida pelo script que chama o R e pode ser substituída (em um arquivo de inicialização do shell, por exemplo) para personalizar o caminho da biblioteca. Essa variável deve ser configurada para uma cadeia de diretórios separada por dois pontos para pesquisar. Como é sempre definido dentro de uma sessão R, a maneira mais fácil de obter um ponto de partida é usar Sys.getenv():

> Sys.getenv('R_LIBS')

[1] "/usr/local/linux/lib/R/site-library:/usr/local/lib/R/site-library:/usr/lib/R/site-library:/usr/lib/R/library"

Você poderia então fazer uma cópia desse caminho, modificá-lo e definir a variável de ambiente R_LIBS para esse valor no shell ou em um script de inicialização.

A alternativa segundo https://www.accelebrate.com/library/how-to-articles/r-rstudio-library, prevê que se altere o arquivo Rprofile dentro do diretório do R. Para tanto, certifique de que o referido diretório R está acessível para alterações (modo administrador). Primeiro cheque a versão em uso do R por meio do menu Tools - Global Options do RStudio.

Figura A.14 RStudio - versão do R).

Figura A.14 RStudio - versão do R).

Em seguida, busca-se o arquivo Rprofile dentro do diretório do R.

Figura A.15 Local do ‘RProfile’).

Figura A.15 Local do ‘RProfile’).

Abra com um editor de texto (pode ser o Bloco de Notas) e acrescente as linhas abaixo ao final do arquivo:

# minha alteracao de diretorio de pacotes
myPaths <- .libPaths()              # busca o diretorio existente
myPaths <- c(myPaths[2], myPaths[1])      # troca entre caminhos
myPaths <- c(myPaths, 'C:/MyRlibs')       # adiciona novo caminho
.libPaths(myPaths)                        # redefine caminho
Figura A.16 Alteração do ‘RProfile’).

Figura A.16 Alteração do ‘RProfile’).

Feito isso, reinicie o Rstudio como administrador e cheque o resultado. Abra o Rstudio e tecle .libPaths()(opção 1), ou em Install Packages, cheque as opções de locais disponíveis para instalar pacotes (opção 2).

Figura A.17 Checar o diretório de pacotes).

Figura A.17 Checar o diretório de pacotes).