UDESC

Motivação

O R é uma linguagem e um ambiente para computação estatística no formato de projeto de software livre de código aberto (open source), ou seja, pode ser utilizado sem custos de licença. Pelo fato de ser um software livre e com o esforço colaborativo mundial de vários pesquisadores o R ? uma plataforma multidisciplinar voltado para análises de dados e referência nos meios científicos.

library(gapminder)
library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.1 ──
## ✔ ggplot2 3.3.6     ✔ purrr   0.3.4
## ✔ tibble  3.1.7     ✔ dplyr   1.0.9
## ✔ tidyr   1.2.0     ✔ stringr 1.4.0
## ✔ readr   2.1.2     ✔ forcats 0.5.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
head(gapminder)
## # A tibble: 6 × 6
##   country     continent  year lifeExp      pop gdpPercap
##   <fct>       <fct>     <int>   <dbl>    <int>     <dbl>
## 1 Afghanistan Asia       1952    28.8  8425333      779.
## 2 Afghanistan Asia       1957    30.3  9240934      821.
## 3 Afghanistan Asia       1962    32.0 10267083      853.
## 4 Afghanistan Asia       1967    34.0 11537966      836.
## 5 Afghanistan Asia       1972    36.1 13079460      740.
## 6 Afghanistan Asia       1977    38.4 14880372      786.
dados <- gapminder %>% filter(year=="2007") %>% dplyr::select(-year)

head(dados)
## # A tibble: 6 × 5
##   country     continent lifeExp      pop gdpPercap
##   <fct>       <fct>       <dbl>    <int>     <dbl>
## 1 Afghanistan Asia         43.8 31889923      975.
## 2 Albania     Europe       76.4  3600523     5937.
## 3 Algeria     Africa       72.3 33333216     6223.
## 4 Angola      Africa       42.7 12420476     4797.
## 5 Argentina   Americas     75.3 40301927    12779.
## 6 Australia   Oceania      81.2 20434176    34435.
dados %>%
  ggplot(aes(x=gdpPercap, y=lifeExp, size=pop, color=continent))+ 
  geom_point(alpha=0.5)+#transparência das bolhas
  scale_size(range = c(.1, 24), name="População")+
  labs(x="PIB", y= "Expectativa de vida")+# legendas
  theme_bw()+ # tema
  scale_color_brewer(palette= "Set1")#cores

Agenda

Utilizando o R

Site R

Instalação

Interface do RStudio

Rstudio

Páginas interessantes

https://www.rstudio.com/resources/cheatsheets/

https://r-graph-gallery.com/index.html

https://rmarkdown.rstudio.com/

https://shiny.rstudio.com/

https://www.r-bloggers.com/

Operações Matemáticas:

Simbolo Operações
+ Soma
- Subtração
 * Multiplicação
/ Divisão
^ ou ** Potência

Operadores relacionais e operadores lógicos

Simbolo Descrição
< Menor
<= Menor ou igual
> Maior
>= Maior ou igual
== Igual (comparação)
! = Diferente
& E
| Ou
! Não
TRUE ou 1 Valor booleano verdadeiro (1)
FALSE ou 0 Valor booleano falso (0)

Funções

Função Descrição
sum(x) Soma todos os elementos do vetor x
sqrt(x) Raiz quadrada de x
length(x) Tamanho do vetor x
log(x) Log natural de x
log(x,b) Log de x com base b
exp(x) Exponencial elevado a x
sin(x) Seno de x
tan(x) tangente de x
mean() Média de x
var(x,y) ou cov(x,y) Covariância entre x e y, ou entre as colunas de x e de y se são matrizes ou data.frame
cor(x,y) Correlação linear entre x e y, ou matriz de correlação se são matrizes ou data.frames
max(x) seleciona o maior elemento do vetor x
min(x) seleciona o menor elemento do vetor x

Alguns comandos úteis.

Função Descrição
setwd(” “) muda o diretório do trabalho
getwd() mostra o diretório do trabalho
ls() lista o nome dos objetos criados na sessão atual
dir() lista todos os arquivos na pasta de trabalho atual
search() lista todos os pacotes carregados
rm() remove o objeto entre parênteses
rm(list=ls(all=TRUE)) remone todos os objetos, limpando a memória
attach() reconhece os objetos dentro de um data frame
detach() função que desfaz o attach

Ajuda no R

# help.start() #ajuda geral do R

help("*")

help(mean)

help.search("mean") # caso não lembre bem o nome da função


?mean #mesmo que help
??mean #mesmo que help.search

apropos("help") #funções contendo "help"
## [1] "help"         "help.request" "help.search"  "help.start"
apropos("mean")
##  [1] ".colMeans"      ".rowMeans"      "colMeans"       "cummean"       
##  [5] "kmeans"         "mean"           "mean_cl_boot"   "mean_cl_normal"
##  [9] "mean_sdl"       "mean_se"        "mean.Date"      "mean.default"  
## [13] "mean.difftime"  "mean.POSIXct"   "mean.POSIXlt"   "rowMeans"      
## [17] "weighted.mean"
#exemplos de uso
example(mean)# exemplo de uso
## 
## mean> x <- c(0:10, 50)
## 
## mean> xm <- mean(x)
## 
## mean> c(xm, mean(x, trim = 0.10))
## [1] 8.75 5.50
#example(plot)

Tipo de dados

Tipo Exemplo
Numérico (numeric) 3, 7.5, 10.01
Inteiro (integer) 3L (a letra L faz o R considerar o número como inteiro)
Caractere (character) “a”,“nome”
Lógico (logical) TRUE, FALSA
Complexo (complex) 1+4i

Tipos de estruturas de dados