1.1 Ambientes R e RStudio

R é um software livre (gratuito) e colaborativo. Além disso, o R também é uma linguagem de programação e por isso está em constante atualização, gerado por sua comunidade ativa ao redor do mundo.

Linguagem de Programação colaborativa: as atualizações são feitas pelos próprios usuários.


Como instalar o R:

R pode ser baixado diretamente de seu site www.r-project.org e está disponível para as plataformas Linux, Windows e MacOS. Para instalar na plataforma Windows siga os passos a seguir:

  1. Acesse o site do R.

  2. Clique em CRAN.

  3. Escolha o Mirror de sua prefência.

  4. Escolha a opção “Download R for Windows”.

  5. Clique na opção “install R for the first time”.

  6. E depois em Download R 4.0.2 for Windows (84 megabytes, 32/64 bit)

  7. Execute o instalador.


RStudio é um ambiente de desenvolvimento integrado(IDE) para o R e está disponível em duas edições: RStudio Desktop e RStudio Server.

Utilizaremos a versão gratuita para desktop. O RStudio possui um apelo visual muito maior que o R usual e busca melhorar a experiência do usuário com o ambiente R.

Note que o RStudio é muito mais organizado e com muito mais funcionalidades, tornando a experiência do usuário muito mais rica e menos cansativa.

A seguir algumas funcionalidades que o RStudio traz ao R:

• Auto-completar de funções.

• Sugestão de funções ou objetos ao escrever palavras similares nas linhas de código.

• Abas específicas para determinada ação, tal como gráficos, bases de dados etc.

• Histórico de códigos utilizados.

• Executor de linhas de código sequenciais.

• Identificação de erros antes de executa-los.

RStudio é gratuito.


Como instalar o RStudio:

  1. Acesse o site do RStudio

  2. Clique na aba Products, depois em RStudio e clique ao final da pagína em DOWNLOAD RSTUDIO DESKTOP.

  3. Escolha o download da aba FREE.

  4. Clique em DOWNLOAD RSTUDIO DESKTOP FOR WINDOWS.

  5. Execute o instalador.


1.2 Primeiros passos no R

Como um primeiro exercício, clique em File> New File> R Script.

Deve aparecer um editor de texto no lado esquerdo da tela. É nesse editor que iremos inserir os nossos comandos, os quais são executados de cima para baixo, na mesma direção em que normalmente o lemos. Note que essa direção de execução introduz uma dinâmica de recursividade: cada comando depende do comando executado nas linhas anteriores.

Após realizar os passos definidos anteriormente, a tela resultante deve ser semelhante à essa:

Tela inicial do RStudio

Tela inicial do RStudio

Sugestão: Modificar o esquema de cores do RStudio para uma configuração mais escura, isto alivia o constante brilho da tela e você poderá trabalhar por mais tempo sem forçar tanto a sua visão. Podes configurar o esquema de cores do RStudio indo na opção Tools > Global Options > Appearance.


Diretório de Trabalho

Assim como outros softwares, o R sempre trabalha em algum diretório. É com base nesse diretório que o R procura arquivos para importar dados. É nesse mesmo diretório que o R salva arquivos caso não definirmos um endereço no computador explicitamente.

Como boa prática de criação e organização de scripts, deve-se sempre mudar o diretório de trabalho para onde o arquivo do script está localizado. Em sua inicialização, o R possui como diretório default a pasta de documentos do usuário.

Para mostrar o diretório atual de trabalho, basta utilizar a função getwd:

my.dir <- getwd()

print(my.dir)
## [1] "C:/Users/User/Desktop/Econometria"

A mudança de diretório de trabalho é realizada através do comando setwd. Por exemplo, caso quiséssemos mudar o nosso diretório de trabalho para C:/Users/User/Desktop/Econometria, bastaria digitar no prompt:

my.d <- 'C:/Users/User/Desktop/Econometria'
setwd(my.d)

1.3 Pacotes no R

Packages (pacotes) são um conjunto de funções que facilitam as rotinas.

O RStudio já possui alguns pacotes pré-instalados que podem ser encontrados na aba Packages, para serem utilizados basta seleciona-los na lista ou utilizar o comando abaixo:

library(knitr)

Caso o pacote que você deseja não esteja disponível ao instalar o RStudio, você pode baixar novos pacotes, basta conhecer o nome do mesmo.


Exemplo prático: vamos instalar o pacote xlsx.

  1. Na aba Packages clique no botão Install.

  2. Caso você nÃo tenha o arquivos.rar do pacote em seu computador (os pacotes também podem ser disponibilizados em sites e/ou repositórios diversos), clique na opção install from escolha a opção:

    Repository(CRAN, CRANextra)

  3. Na opção Packages insira o nome do pacote desejado , neste caso xlsx.

  4. Clique no botão install sem alterar as opções padrão.

Ou de maneira análoga utilizando o comando:

install.packages("xlsx")

Após o procedimento anterior o RStudio fará o download do pacote e o instalará em sua máquina automaticamente.

Observação: Após instalar o pacote você precisará utilizar o comando library novamente. Após isso as funcionalidades do pacote estarão prontas para serem usadas. Lembre-se que sempre que abrir o RStudio será necessário carregar o pacote novamente.


Para ober informações sobre os pacotes: Na aba Packages clique em cima do nome do pacote e entao será aberta a janela help com várias informações sobre o pacote e suas funções.

Para a descrição de alguma função específicas utilize o comando abaixo:

help(ivreg) 

ou

?ivreg 

Caso você precise citar o pacote utilizado, nas referências de um artigo por exemplo, utiize o seguinte comando:

citation("xlsx")

1.4 Memoria RAM e objetos

Como o R é uma linguagem de programação, precisamos entender um pouco o que é memória RAM. No computador existem dois tipos de memória, a de execução e a de armazenagem. Para executar determinada ação, o computador precisa utilizar um espaço finito de memória de execuçãao, que é nossa memória RAM. Por exemplo, se a função exp(a) necessita de 8 bits de memória RAM e só temos disponível 4 bits, esta funçãao não será executada.

Existem vários tipos de linguagens de programção, o R por exemplo é uma linguagem voltada à objetos. Para entender melhor este conceito vamos estudar o exemplo a seguir:

No seu console escreva os seguintes códigos:

x = 10
y = 20

Ao fazer os comando acima estamos dando valores a x e y e salvando-os na memória RAM. Você vai ver que na janela Environment no espaço values estarão x e y com seus respectivos valores. Podemos chamar x e y de objetos e estes estão armazenados na memória RAM. Com estes objetos podemos fazer várias operações como:

x + y
x*y
x/y
(x + y)^(x/y)

Limpando a Memória

Após a criação de diversas variáveis, o ambiente de trabalho do R pode ficar cheio de conteúdo já utilizado e dispensável. Nesse caso, é desejável limpar a memória do programa.

Geralmente isso é realizado no começo de um script, de forma que toda vez que o script for executado, a memória estará totalmente limpa antes de qualquer cálculo. Além de desocupar a memória do computador, isso ajuda a evitar possíveis erros no código. Para a grande maioria dos casos, a limpeza do ambiente de trabalho deve ser realizada apenas uma vez.


Por exemplo, dada uma nova variável z, podemos excluí-la da memória com o comando rm, conforme mostrado a seguir:

# criando a variável z
z <- 2

# mostra todos os objetos existentes
ls()
## [1] "my.dir" "x"      "y"      "z"
# remove z da memória
rm('z')

# mostra os objetos restantes
ls()
## [1] "my.dir" "x"      "y"

Observe que o objeto z não estará mais mais disponível após o uso do comando rm('z').

Em situações práticas, porém, é desejável limpar toda a memória utilizada por todos os objetos criados no R. Pode-se atingir esse objetivo com o seguinte código:

# limpar toda a memória (todos os objetos existentes)
rm(list=ls())

O termo list é um argumento da função rm, o qual define quais objetos serão eliminados. Já o comando ls() mostra todas os objetos disponíveis atualmente. Portanto, ao encadear ambos os comandos, limpamos da memória todos os objetos disponíveis para o R. Como comentado, uma boa política de programação é sempre iniciar o script limpando a memória do R.


Atenção: No R existe diferença entre letras maiúsculas e minúsculas, por isso muito cuidado ao definir objetos. O separador de decimais no R é dado por um ponto(.), por exemplo: 10,2 é escrito no R como 10.2.


1.5 Importar base de dados

Para importar uma base de dados para o RStudio, como uma base do excel .xlsx por exemplo, utilizamos o pocote xlsx e a função abaixo:

read.xlsx("nome do arquivo.xlsx", sheetName = "janela do arquivo excel")

De uma meneira mais geral, o RStudio permite realizar estas operações de maneira manual através da seguinte sequência:

Environment > Import Dataset > From 'tipo de arquivo' > Import

Como você pode observar a seguir:

Note que ao executar de forma manual, o RStudio já mostra anteriormente o código na parte inferior a direita.


Bem por hoje era isso, até a próxima aula!