O desenvolvimento original do R foi realizado por Robert Gentleman e Ross Ihaka na Universidade de Auckland no início dos anos 1990, tornando-se uma das linguagens de programação estatística mais populares. O desenvolvimento contínuo desta linguagem de código aberto foi assumido por uma equipe internacional de acadêmicos, programadores, estatísticos e matemáticos. Uma das razões para a popularidade do R é que ele é gratuito, o que permite aos usuários contribuírem para o desenvolvimento de novas ferramentas. Além disso, os usuários podem implementar o que é quase certamente a mais extensa gama de modelos estatísticos, usando o códigos R existentes.
Uma das principais características desta linguagem de código aberto é que os usuários podem estender, aprimorar e substituir qualquer parte dela. Além disso, essas modificações podem ser disponibilizadas para outros usuários, na forma de vários pacotes R. Por exemplo, existem milhares de pacotes na Comprehensive R Archive Network (CRAN), que seguem um padrão de codificação e são submetidos a testes. Adicionalmente, existem muitos outros pacotes R que podem ser encontrados em repositórios de usuários, como GitLab, GitHub, BitBucket, etc. Como não é necessário obter uma licença de usuário para utilizar este software, é relativamente simples mover uma tarefa específica para a nuvem, o que oferece aos usuários ganhos significativas de poder computacional e instalações de armazenamento que podem ser fornecidas por fornecedores como Amazon Web Services (AWS), Google Cloud Platform (GCP), Microsoft Azure, DigitalOcean, etc.
A linguagem R pode ser executada em quase qualquer sistema operacional e facilita a programação orientada a objetos, programação funcional e mais. Pode ser usada para trabalhar com uma grande variedade de tipos diferentes de conjuntos de dados e existem várias interfaces desenvolvidas que permitem que o R funcione com outros programas, códigos-fonte, bancos de dados e interfaces de programação de aplicativos (APIs). A lista de interfaces é muito longa para mencionar aqui, mas incluiria Excel, Matlab, Stata, Python, Julia, C++, Octave, JavaScript, Fortran, Spark, Hadoop, SQL, Oracle, Bloomberg, Datastream, etc.
Muitas instituições de pesquisa, empresas e universidades também migraram para o R, então há uma boa chance de que você precise trabalhar com este software em algum momento no futuro. A linguagem R é particularmente adequada para as seguintes três tarefas: (a) manipulação de dados, (b) visualização de dados, e (c) modelagem estatística & aprendizado de máquina .
Para baixar e instalar o R pela primeira vez, visite a página:
Selecione a versão do R compatível com o seu sistema
operacional. Se estiver instalando no Windows pela primeira vez, escolha
“install R for the first time”. Usuários de Mac OS X devem
baixar o pacote mais recente R-x.x.x.pkg e usuários de
Linux devem selecionar a distribuição apropriada (debian, redhat, suse
ou ubuntu) e seguir as instruções fornecidas.
Além do R, recomenda-se instalar ferramentas de desenvolvimento para interface com contas GitLab ou GitHub e acessar outros recursos interessantes da linguagem.
Embora o download inclua uma interface gráfica de usuário (GUI), é comum o uso de IDEs como JupyterLab e RStudio:
Durante as aulas de monitoria, usaremos o RStudio, mas os scripts também funcionarão no JupyterLab. A escolha do IDE depende de suas preferências.
O IDE RStudio tem contribuído significativamente para a popularidade do R. Ele inclui várias ferramentas úteis para integração com repositórios Git e publicação de documentos R Markdown, que combinam texto narrativo e código para produzir relatórios, artigos, livros, slides e mais, de forma elegante. Para nossas aplicações, usaremos a licença Open Source para RStudio Desktop, que pode ser baixada gratuitamente em:
https://rstudio.com/products/rstudio/download/
Após executar algumas linhas de código, a tela deverá se assemelhar
ao mostrado na figura abaixo. Para executar algumas linhas, selecione-as
e use o atalho Ctrl+Enter.
Depois de abrir um script *.R, ele normalmente é exibido
no canto superior esquerdo. É possível visualizar múltiplos arquivos de
programa ao mesmo tempo e executar arquivos inteiros, linhas únicas ou
um subconjunto de uma linha.