UDESC
O R é uma linguagem e um ambiente para computação estatística no formato de projeto de software livre de código aberto (open source), ou seja, pode ser utilizado sem custos de licença. Pelo fato de ser um software livre e com o esforço colaborativo mundial de vários pesquisadores o R ? uma plataforma multidisciplinar voltado para análises de dados e referência nos meios científicos.
library(gapminder)
library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.1 ──
## ✔ ggplot2 3.3.6 ✔ purrr 0.3.4
## ✔ tibble 3.1.7 ✔ dplyr 1.0.9
## ✔ tidyr 1.2.0 ✔ stringr 1.4.0
## ✔ readr 2.1.2 ✔ forcats 0.5.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
head(gapminder)
## # A tibble: 6 × 6
## country continent year lifeExp pop gdpPercap
## <fct> <fct> <int> <dbl> <int> <dbl>
## 1 Afghanistan Asia 1952 28.8 8425333 779.
## 2 Afghanistan Asia 1957 30.3 9240934 821.
## 3 Afghanistan Asia 1962 32.0 10267083 853.
## 4 Afghanistan Asia 1967 34.0 11537966 836.
## 5 Afghanistan Asia 1972 36.1 13079460 740.
## 6 Afghanistan Asia 1977 38.4 14880372 786.
dados <- gapminder %>% filter(year=="2007") %>% dplyr::select(-year)
head(dados)
## # A tibble: 6 × 5
## country continent lifeExp pop gdpPercap
## <fct> <fct> <dbl> <int> <dbl>
## 1 Afghanistan Asia 43.8 31889923 975.
## 2 Albania Europe 76.4 3600523 5937.
## 3 Algeria Africa 72.3 33333216 6223.
## 4 Angola Africa 42.7 12420476 4797.
## 5 Argentina Americas 75.3 40301927 12779.
## 6 Australia Oceania 81.2 20434176 34435.
dados %>%
ggplot(aes(x=gdpPercap, y=lifeExp, size=pop, color=continent))+
geom_point(alpha=0.5)+#transparência das bolhas
scale_size(range = c(.1, 24), name="População")+
labs(x="PIB", y= "Expectativa de vida")+# legendas
theme_bw()+ # tema
scale_color_brewer(palette= "Set1")#cores
Site R
O R é uma linguagem orientada a objetos criada em 1996 por Ross Ihaka e Robert Gentleman que aliada a um ambiente integrado permite a manipulação de dados, realização de cálculos e geração de gráficos.
R pode ser obtido gratuitamente em http://cran.r-project.org, onde é apresentado em versões de acordo com o sistema operacional
A página central do R é: http://www.r-project.org/
Para fazer o download, você deve usar um “Cran Mirror”, clicando em CRAN na margem esquerda.
No Brasil, temos: (escolha um destes)
No Cran escolhido, você escolhe o sistema operacional de sua máquina (p. ex., Windows) e faça o download do programa básico: “Base”.
Observe que na página do Download tem algumas informações úteis. Para instalar o programa básico, basta executar o arquivo R-(versão) - (sistema operacional).exe que você baixou.
Após a instalação do R , faça a instalação do Rstudio, que está disponível em http://rstudio.org/.
O download do RStudio está disponível para vários sistemas operacionais
A tela principal do RStudio, diferentemente do R, é disposta em 4 janelas. A apresentação padrão é a da Figura 1. No canto superior a esquerda é apresentada a janela Source, na qual são disponibilizados os scripts (códigos de programação previamente redigidos e salvos em arquivo com extensão .R), arquivos de texto, documentos Sweave, documentação do R e documentos TeX.
Na janela superior a direita, a primeira aba é disponibilizada para gerenciar diferentes áreas de trabalho. Já na segunda aba desta janela fica registrado o histórico de todos os scripts, funções e ações executadas.
Na parte inferior a esquerda, localiza-se a janela do Console, a mesma janela padrão disponibilizada no R. E finalmente, na janela inferior a direita, são agrupadas em uma janela outras 4 abas: a primeira delas é um gerenciador de arquivos (aba File), na segunda são exibidos os gráficos gerados pelo RStudio (aba Plots). Na terceira aba são apresentados os pacotes já instalados (aba Packages). E finalmente, a quarta aba trata-se da Ajuda (aba Help) do R/RStudio.
Rstudio
Na janela Source ao editar o script é possível comentar ou não automaticamente (sem necessidade de digitação) determinada parte do código utilizando a opção Edit/Comment/Uncomment Lines, mantendo o cursor na linha a ser executada ou selecionar o conjunto de linhas desejado. Nesta tela, também é possível indentar automaticamente comandos, uma prática comum na organização de scripts na área da computação.
Os scripts podem ser executados por meio do botão Run, não havendo mais necessidade de clicar com o botão direito do mouse linha a linha do script. Também é possível executar várias linhas de comando, selecionando as linhas desejadas e executando-as por meio do botão Run ou pelas teclas Ctrl+Enter.
Tal como acontece com o Console padrão do R, o Console do RStudio permite executar comandos usados anteriormente por meio das teclas Up (↑) e Down (↓). Além disso, apresenta uma lista de comandos usados recentemente, por meio das teclas Ctrl+Up (↑) ou Crtl+Down (↓).
Na aba Workspace da tela superior a direita do RStudio é apresentada a área de trabalho onde seus dados são apresentados em forma de conjunto de dados (vetores, matrizes, etc.) disponíveis na área de trabalho e variáveis, que podem ser alterados por meio de duplo clique. Nesta aba também é possível carregar um conjunto de dados e carregar uma nova área de trabalho, alternando-se facilmente entre elas.
Na aba Plots da tela inferior a direita do RStudio onde são apresentados os gráficos gerados, é possível salvar as imagens em formado PDF e figuras de diferentes formatos (JPG, BMP, TIFF, PNG, metalife,etc.)
As linhas iniciadas pelo símbolo # são consideradas comentários.
Os comandos são separados por ponto e vírgula (“;”) ou são inseridos em nova linha; podem agrupar-se dentro de chaves (“{…}”); há distinção entre letras maiúsculas e minúsculas; se ao terminar a linha, o comando não está totalmente completo, irá aparecer o símbolo de “+” na próxima linha para continuação, usando o Console.
https://www.rstudio.com/resources/cheatsheets/
https://r-graph-gallery.com/index.html
| Simbolo | Operações |
|---|---|
| + | Soma |
| - | Subtração |
| * | Multiplicação |
| / | Divisão |
| ^ ou ** | Potência |
| Simbolo | Descrição |
|---|---|
| < | Menor |
| <= | Menor ou igual |
| > | Maior |
| >= | Maior ou igual |
| == | Igual (comparação) |
| ! = | Diferente |
| & | E |
| | | Ou |
| ! | Não |
| TRUE ou 1 | Valor booleano verdadeiro (1) |
| FALSE ou 0 | Valor booleano falso (0) |
| Função | Descrição |
|---|---|
| sum(x) | Soma todos os elementos do vetor x |
| sqrt(x) | Raiz quadrada de x |
| length(x) | Tamanho do vetor x |
| log(x) | Log natural de x |
| log(x,b) | Log de x com base b |
| exp(x) | Exponencial elevado a x |
| sin(x) | Seno de x |
| tan(x) | tangente de x |
| mean() | Média de x |
| var(x,y) ou cov(x,y) | Covariância entre x e y, ou entre as colunas de x e de y se são matrizes ou data.frame |
| cor(x,y) | Correlação linear entre x e y, ou matriz de correlação se são matrizes ou data.frames |
| max(x) | seleciona o maior elemento do vetor x |
| min(x) | seleciona o menor elemento do vetor x |
| Função | Descrição |
|---|---|
| setwd(” “) | muda o diretório do trabalho |
| getwd() | mostra o diretório do trabalho |
| ls() | lista o nome dos objetos criados na sessão atual |
| dir() | lista todos os arquivos na pasta de trabalho atual |
| search() | lista todos os pacotes carregados |
| rm() | remove o objeto entre parênteses |
| rm(list=ls(all=TRUE)) | remone todos os objetos, limpando a memória |
| attach() | reconhece os objetos dentro de um data frame |
| detach() | função que desfaz o attach |
# help.start() #ajuda geral do R
help("*")
help(mean)
help.search("mean") # caso não lembre bem o nome da função
?mean #mesmo que help
??mean #mesmo que help.search
apropos("help") #funções contendo "help"
## [1] "help" "help.request" "help.search" "help.start"
apropos("mean")
## [1] ".colMeans" ".rowMeans" "colMeans" "cummean"
## [5] "kmeans" "mean" "mean_cl_boot" "mean_cl_normal"
## [9] "mean_sdl" "mean_se" "mean.Date" "mean.default"
## [13] "mean.difftime" "mean.POSIXct" "mean.POSIXlt" "rowMeans"
## [17] "weighted.mean"
#exemplos de uso
example(mean)# exemplo de uso
##
## mean> x <- c(0:10, 50)
##
## mean> xm <- mean(x)
##
## mean> c(xm, mean(x, trim = 0.10))
## [1] 8.75 5.50
#example(plot)
| Tipo | Exemplo |
|---|---|
| Numérico (numeric) | 3, 7.5, 10.01 |
| Inteiro (integer) | 3L (a letra L faz o R considerar o número como inteiro) |
| Caractere (character) | “a”,“nome” |
| Lógico (logical) | TRUE, FALSA |
| Complexo (complex) | 1+4i |
Vetores: conjunto de elementos de uma mesma natureza.
Matrizes: conjunto de elementos de uma mesma natureza organizado em linhas e colunas.
Array: generaliza a ideia de matriz. Enquanto em uma matriz os elementos são organizados em duas dimensões (linhas e colunas), em um array os elementos podem ser organizados em um número arbitrário de dimensões.
Data frames: similar como matrizes, porém diferentes colunas podem possuir elementos de natureza diferentes.
Listas: generalizações de vetores, representa uma coleção de objetos.