Neste documento se enocntram feitos os exercícios do capitulo 7 do livro Utilizando a Linguagem R da professora Dra. Luciane Ferreira Alcoforada, com base nas soluções oferecidas no messmo livro.
Produção de gráficos com o pacote básico do R.
Banco de dados
dados <- read.csv2("https://raw.githubusercontent.com/Lucianea/Alta/master/turismo.csv", sep = ",")
[1] Histograma
hist(dados$cheg_2014/1000,
col = "darkblue",
main = "Histograma",
xlab = "Número de chegadas por mil (ano 2014)",
ylab = "Frequência",
sub = "Fonte: capitulo 7 do livro Utilizando a Linguagem R")
[2] Boxplot
boxplot(dados$cheg_2014/1000,
col = "darkblue",
main = "Boxplot",
xlab = "Número de chegadas (ano 2014)",
sub = "Fonte: capitulo 7 do livro Utilizando a Linguagem R")
[3] Ramo e folhas
stem(dados$cheg_2014)
##
## The decimal point is 4 digit(s) to the right of the |
##
## 0 | 11111111112222222222222233333333333333333333333333333444444444444444+47
## 2 | 44689069
## 4 | 1113700334559
## 6 | 1
## 8 | 2900178
## 10 | 0476
## 12 | 290
## 14 | 7789
## 16 | 01462
## 18 | 40
## 20 | 6
## 22 | 25
## 24 | 1
## 26 | 8
## 28 |
## 30 |
## 32 |
## 34 | 2
[4] Grade de dispersão
pairs(dados)
[5] Pizza
dt <- table(dados$Estado[dados$cheg_2014 > 150000])
dt <- dt[dt > 0]
y <- dt
x <- names(dt)
porc <- 100*round(y/sum(y), 2)
rotulos <- paste(x, "(",porc,"%)", sep = "")
par(mar = c(4, 0, 2, 0), mai = c(0.8, 0, 0.4, 0))
pie(y,
main = "Estados com chegadas de turistas acima de 150 mil em 2014",
labels = rotulos,
cex.main = 2,
cex = 1.5,
col = gray(1:length(x)/length(x)))
[6] Dispersão
plot(dados$cheg_2012, dados$cheg_2013)
[7] QQnorm
qqnorm(dados$cheg_2012)
Produção de gráficos com o pacote ggplot2.
[1] Extraia os dados de São Paulo, Rio de Janeiro e Rio Grande do Sul e apresente um gráfico de barras lado a lado, comparando o total de chegadas do ano de 2014 a 2015.
library(tidyverse)
dadose1 <- dados %>%
filter(Estado == "SaoPaulo" | Estado == "RioJaneiro" | Estado == "RioGrandeSul") %>%
select(Mes, Estado, cheg_2014, cheg_2015) %>%
rename("2014" = "cheg_2014", "2015" = "cheg_2015") %>%
gather(ano, chegadas, "2014":"2015") %>%
group_by(ano, Estado) %>%
summarise(soma = sum(chegadas))
dadose1
## # A tibble: 6 × 3
## # Groups: ano [2]
## ano Estado soma
## <chr> <fct> <int>
## 1 2014 RioGrandeSul 907670
## 2 2014 RioJaneiro 1597153
## 3 2014 SaoPaulo 2219917
## 4 2015 RioGrandeSul 1080478
## 5 2015 RioJaneiro 1375978
## 6 2015 SaoPaulo 2248811
pe1 <- ggplot(dadose1, aes(x = Estado, y = soma))
pe1+
geom_bar(stat = "identity",
aes(fill = Estado),
position = "dodge")+
labs(x = "Estado",
y = "No. de Chegadas",
title = "Visualizando o desempenho dos Estados RS, RJ e SP",
subtitle = "Fonte: Capitulo 7 do livro Utilizando a Linguagem R",
names = "Estado")+
theme_bw(base_size = 18)
[2] Elabore um gráfico de pizza para a proporção de chegadas de turistas em cada região do Brasil.
d <- aggregate(cheg_2012 ~ Regiao, data = dados, sum)
ggplot(d, aes(x = 1, weight = cheg_2012, fill = Regiao))+
geom_bar()+
coord_polar(theta = "y")+
geom_text(x = 1.3,
aes(y = cumsum(cheg_2012[length(Regiao): 1]) - cheg_2012[length(Regiao): 1]/2,
label = paste0(100 * round(cheg_2012[length(Regiao): 1]/sum(cheg_2012[length(Regiao): 1]), 3), "%")))
[3] Elabore um gráfico que exiba a variabilidade de chegadas dos Estados de SP e RS, apresentando-o numa malha em que figure as regiões do Brasil nas quais esses Estados estão inseridos.
dados_bi <- dados %>%
filter(Estado == "SaoPaulo" | Estado == "RioGrandeSul")
p <- dados_bi %>%
ggplot(aes(x = Estado, y = cheg_2012))+
labs(subtitle = "Fonte: Capitulo 7 do livro Utilizando a Linguagem R")+
geom_boxplot(fill = "red",
colour = "green",
alpha = 0.7,
outlier.colour = "blue",
outlier.shape = 1)+
facet_grid( ~ Regiao)
p
[4] Apresente um gráfico de linhas com o número de chegadas de turistas ao Estado do Rio de Janeiro no período 2012-2015 e apresente a sua vização.
dados_chegadas <- data.frame(Estado = rep(dados$Estado, 4),
Mes = rep(dados$Mes, 4),
chegadas = c(dados$cheg_2012, dados$cheg_2013, dados$cheg_2014,
dados$cheg_2015),
Regiao = rep(dados$Regiao, 4),
Ano = rep(2012:2015, rep(180, 4)))
ggplot(subset(dados_chegadas, Estado %in% c("RioJaneiro")),
aes(x = Mes,
y = chegadas,
shape = Estado))+
scale_x_continuous(limits = c(1, 12),
breaks = seq(1, 12, 1))+
geom_point()+
geom_smooth()+
labs(subtitle = "Fonte: Capitulo 7 do livro Utilizando a Linguagem R")
Link do livro: https://altabooks.com.br/produto/utilizando-a-linguagem-r/