1 - Introdução

Desenvolvimento Original do R

O desenvolvimento original do R foi realizado por Robert Gentleman e Ross Ihaka na Universidade de Auckland no início dos anos 1990, tornando-se uma das linguagens de programação estatística mais populares. O desenvolvimento contínuo desta linguagem de código aberto foi assumido por uma equipe internacional de acadêmicos, programadores, estatísticos e matemáticos. Uma das razões para a popularidade do R é que ele é gratuito, o que permite aos usuários contribuírem para o desenvolvimento de novas ferramentas. Além disso, os usuários podem implementar o que é quase certamente a mais extensa gama de modelos estatísticos, usando o códigos R existentes.

Características Chave

Uma das principais características desta linguagem de código aberto é que os usuários podem estender, aprimorar e substituir qualquer parte dela. Além disso, essas modificações podem ser disponibilizadas para outros usuários, na forma de vários pacotes R. Por exemplo, existem milhares de pacotes na Comprehensive R Archive Network (CRAN), que seguem um padrão de codificação e são submetidos a testes. Adicionalmente, existem muitos outros pacotes R que podem ser encontrados em repositórios de usuários, como GitLab, GitHub, BitBucket, etc. Como não é necessário obter uma licença de usuário para utilizar este software, é relativamente simples mover uma tarefa específica para a nuvem, o que oferece aos usuários ganhos significativas de poder computacional e instalações de armazenamento que podem ser fornecidas por fornecedores como Amazon Web Services (AWS), Google Cloud Platform (GCP), Microsoft Azure, DigitalOcean, etc.

Versatilidade e Interfaces

A linguagem R pode ser executada em quase qualquer sistema operacional e facilita a programação orientada a objetos, programação funcional e mais. Pode ser usada para trabalhar com uma grande variedade de tipos diferentes de conjuntos de dados e existem várias interfaces desenvolvidas que permitem que o R funcione com outros programas, códigos-fonte, bancos de dados e interfaces de programação de aplicativos (APIs). A lista de interfaces é muito longa para mencionar aqui, mas incluiria Excel, Matlab, Stata, Python, Julia, C++, Octave, JavaScript, Fortran, Spark, Hadoop, SQL, Oracle, Bloomberg, Datastream, etc.

Adesão e Adequação

Muitas instituições de pesquisa, empresas e universidades também migraram para o R, então há uma boa chance de que você precise trabalhar com este software em algum momento no futuro. A linguagem R é particularmente adequada para as seguintes três tarefas: (a) manipulação de dados, (b) visualização de dados, e (c) modelagem estatística & aprendizado de máquina .

2-Instalando o R na Sua Máquina

Para baixar e instalar o R pela primeira vez, visite a página:

http://cran.r-project.org

Selecione a versão do R compatível com o seu sistema operacional. Se estiver instalando no Windows pela primeira vez, escolha “install R for the first time”. Usuários de Mac OS X devem baixar o pacote mais recente R-x.x.x.pkg e usuários de Linux devem selecionar a distribuição apropriada (debian, redhat, suse ou ubuntu) e seguir as instruções fornecidas.

Ferramentas de Desenvolvimento (Opcional)

Além do R, recomenda-se instalar ferramentas de desenvolvimento para interface com contas GitLab ou GitHub e acessar outros recursos interessantes da linguagem.

Ambiente de Desenvolvimento Integrado (IDE)

Embora o download inclua uma interface gráfica de usuário (GUI), é comum o uso de IDEs como JupyterLab e RStudio:

  • JupyterLab: Ideal se você pretende usar outras linguagens como Python ou Julia.
  • RStudio: Melhor para focar em modelagem estatística e aprendizado de máquina. É mais fácil de instalar.

Durante as aulas de monitoria, usaremos o RStudio, mas os scripts também funcionarão no JupyterLab. A escolha do IDE depende de suas preferências.

3 - RStudio

O IDE RStudio tem contribuído significativamente para a popularidade do R. Ele inclui várias ferramentas úteis para integração com repositórios Git e publicação de documentos R Markdown, que combinam texto narrativo e código para produzir relatórios, artigos, livros, slides e mais, de forma elegante. Para nossas aplicações, usaremos a licença Open Source para RStudio Desktop, que pode ser baixada gratuitamente em:

https://rstudio.com/products/rstudio/download/

Visão Geral do Desktop

Após executar algumas linhas de código, a tela deverá se assemelhar ao mostrado na figura abaixo. Para executar algumas linhas, selecione-as e use o atalho Ctrl+Enter.

Desktop Rstudio
Desktop Rstudio

Depois de abrir um script *.R, ele normalmente é exibido no canto superior esquerdo. É possível visualizar múltiplos arquivos de programa ao mesmo tempo e executar arquivos inteiros, linhas únicas ou um subconjunto de uma linha.

  • Environment: Todas as variáveis, matrizes, escalares, objetos, strings, etc., são armazenadas no canto superior direito.
  • Plots: Qualquer tipo de gráfico pode ser construído e exibido no painel inferior direito e exportado como jpeg, pdf, etc.
  • Console: Localizado no canto inferior esquerdo, pode ser usado para inserir comandos ou fornecer saída.
  • Data: Clique duplo em um elemento de dados no Environment para exibi-lo em uma tabela no painel esquerdo.
  • Aba de Arquivos: Permite navegar pelo diretório atual. O arquivo do projeto, com extensão *.Rproj, cuida da configuração do projeto para garantir funcionalidade consistente.
  • Ajuda: Função de ajuda útil que fornece o formato exato dos comandos, exemplos de uso e referências de livros/revistas.
  • Pacotes: Aba para instalar e usar pacotes, ligando você ao repositório na web. Alguns pacotes incluem arquivos úteis, que explicam a metodologia e aplicação do pacote, com exemplos práticos.