Neste documento se enocntram feitos os exercícios do capitulo 7 do livro Utilizando a Linguagem R da professora Dra. Luciane Ferreira Alcoforada, com base nas soluções oferecidas no messmo livro.

Produção de gráficos com o pacote básico do R.

Banco de dados

dados <- read.csv2("https://raw.githubusercontent.com/Lucianea/Alta/master/turismo.csv", sep = ",")

[1] Histograma

hist(dados$cheg_2014/1000,
     col = "darkblue",
     main = "Histograma",
     xlab = "Número de chegadas por mil (ano 2014)",
     ylab = "Frequência",
     sub = "Fonte: capitulo 7 do livro Utilizando a Linguagem R")

[2] Boxplot

boxplot(dados$cheg_2014/1000,
        col = "darkblue",
        main = "Boxplot",
        xlab = "Número de chegadas (ano 2014)",
        sub = "Fonte: capitulo 7 do livro Utilizando a Linguagem R")

[3] Ramo e folhas

stem(dados$cheg_2014)
## 
##   The decimal point is 4 digit(s) to the right of the |
## 
##    0 | 11111111112222222222222233333333333333333333333333333444444444444444+47
##    2 | 44689069
##    4 | 1113700334559
##    6 | 1
##    8 | 2900178
##   10 | 0476
##   12 | 290
##   14 | 7789
##   16 | 01462
##   18 | 40
##   20 | 6
##   22 | 25
##   24 | 1
##   26 | 8
##   28 | 
##   30 | 
##   32 | 
##   34 | 2

[4] Grade de dispersão

pairs(dados)

[5] Pizza

dt <- table(dados$Estado[dados$cheg_2014 > 150000])
dt <- dt[dt > 0]

y <- dt
x <- names(dt)

porc <- 100*round(y/sum(y), 2)
rotulos <- paste(x, "(",porc,"%)", sep = "")
par(mar = c(4, 0, 2, 0), mai = c(0.8, 0, 0.4, 0))
pie(y, 
    main = "Estados com chegadas de turistas acima de 150 mil em 2014",
    labels = rotulos, 
    cex.main = 2,
    cex = 1.5,
    col = gray(1:length(x)/length(x)))

[6] Dispersão

plot(dados$cheg_2012, dados$cheg_2013)

[7] QQnorm

qqnorm(dados$cheg_2012)

Produção de gráficos com o pacote ggplot2.

[1] Extraia os dados de São Paulo, Rio de Janeiro e Rio Grande do Sul e apresente um gráfico de barras lado a lado, comparando o total de chegadas do ano de 2014 a 2015.

library(tidyverse)

dadose1 <- dados %>% 
  filter(Estado == "SaoPaulo" | Estado == "RioJaneiro" | Estado == "RioGrandeSul") %>% 
  select(Mes, Estado, cheg_2014, cheg_2015) %>% 
  rename("2014" = "cheg_2014", "2015" = "cheg_2015") %>% 
  gather(ano, chegadas, "2014":"2015") %>% 
  group_by(ano, Estado) %>% 
  summarise(soma = sum(chegadas))

dadose1
## # A tibble: 6 × 3
## # Groups:   ano [2]
##   ano   Estado          soma
##   <chr> <fct>          <int>
## 1 2014  RioGrandeSul  907670
## 2 2014  RioJaneiro   1597153
## 3 2014  SaoPaulo     2219917
## 4 2015  RioGrandeSul 1080478
## 5 2015  RioJaneiro   1375978
## 6 2015  SaoPaulo     2248811
pe1 <- ggplot(dadose1, aes(x = Estado, y = soma))

pe1+
  geom_bar(stat = "identity",
           aes(fill = Estado),
           position = "dodge")+
  labs(x = "Estado", 
       y = "No. de Chegadas",
       title = "Visualizando o desempenho dos Estados RS, RJ e SP",
       subtitle = "Fonte: Capitulo 7 do livro Utilizando a Linguagem R",
       names = "Estado")+
  theme_bw(base_size = 18)

[2] Elabore um gráfico de pizza para a proporção de chegadas de turistas em cada região do Brasil.

d <- aggregate(cheg_2012 ~ Regiao, data = dados, sum)
ggplot(d, aes(x = 1, weight = cheg_2012, fill = Regiao))+
  geom_bar()+
  coord_polar(theta = "y")+
  geom_text(x = 1.3,
            aes(y = cumsum(cheg_2012[length(Regiao): 1]) - cheg_2012[length(Regiao): 1]/2,
                label = paste0(100 * round(cheg_2012[length(Regiao): 1]/sum(cheg_2012[length(Regiao): 1]), 3), "%")))

[3] Elabore um gráfico que exiba a variabilidade de chegadas dos Estados de SP e RS, apresentando-o numa malha em que figure as regiões do Brasil nas quais esses Estados estão inseridos.

dados_bi <- dados %>% 
  filter(Estado == "SaoPaulo" | Estado == "RioGrandeSul")

p <- dados_bi %>% 
  ggplot(aes(x = Estado, y = cheg_2012))+
  labs(subtitle = "Fonte: Capitulo 7 do livro Utilizando a Linguagem R")+
  geom_boxplot(fill = "red",
               colour = "green",
               alpha = 0.7,
               outlier.colour = "blue",
               outlier.shape = 1)+
  facet_grid( ~ Regiao)
p

[4] Apresente um gráfico de linhas com o número de chegadas de turistas ao Estado do Rio de Janeiro no período 2012-2015 e apresente a sua vização.

dados_chegadas <- data.frame(Estado = rep(dados$Estado, 4),
                             Mes = rep(dados$Mes, 4),
                             chegadas = c(dados$cheg_2012, dados$cheg_2013, dados$cheg_2014,
                                         dados$cheg_2015),
                             Regiao = rep(dados$Regiao, 4),
                             Ano = rep(2012:2015, rep(180, 4)))

ggplot(subset(dados_chegadas, Estado %in% c("RioJaneiro")),
              aes(x = Mes,
                  y = chegadas, 
                  shape = Estado))+
  scale_x_continuous(limits = c(1, 12),
                     breaks = seq(1, 12, 1))+
  geom_point()+
  geom_smooth()+
  labs(subtitle = "Fonte: Capitulo 7 do livro Utilizando a Linguagem R")

Link do livro: https://altabooks.com.br/produto/utilizando-a-linguagem-r/