#Lista 4 - Gráficos
##Importando o conjunto de dados
dados=read.csv2("https://raw.githubusercontent.com/Lucianea/Alta/master/turismo.csv",
sep=",") #sep=, indica que o separador na tabela das colunas é uma ,
Observando os dados
head(dados)
## Mes Estado cheg_2012 cheg_2013 cheg_2014 cheg_2015 C_Estado Regiao
## 1 1 Amazonas 3717 4945 3581 4423 1 Norte
## 2 2 Amazonas 4048 3905 2915 3187 1 Norte
## 3 3 Amazonas 3581 2449 2797 3666 1 Norte
## 4 4 Amazonas 1914 1447 1474 3392 1 Norte
## 5 5 Amazonas 1567 2152 3225 3406 1 Norte
## 6 6 Amazonas 3237 2606 13309 4271 1 Norte
summary(dados)
## Mes Estado cheg_2012 cheg_2013
## Min. : 1.00 Length:180 Min. : 780 Min. : 617
## 1st Qu.: 3.75 Class :character 1st Qu.: 3076 1st Qu.: 2951
## Median : 6.50 Mode :character Median : 5500 Median : 5708
## Mean : 6.50 Mean : 31538 Mean : 32296
## 3rd Qu.: 9.25 3rd Qu.: 40004 3rd Qu.: 40176
## Max. :12.00 Max. :225960 Max. :235714
## cheg_2014 cheg_2015 C_Estado Regiao
## Min. : 531 Min. : 694 Min. : 1 Length:180
## 1st Qu.: 3333 1st Qu.: 3584 1st Qu.: 4 Class :character
## Median : 6050 Median : 6206 Median : 8 Mode :character
## Mean : 35721 Mean : 35032 Mean : 8
## 3rd Qu.: 39626 3rd Qu.: 29488 3rd Qu.:12
## Max. :352042 Max. :405845 Max. :15
#Exercicio 1 1) Usando a função aggregate crie uma tabela com o número de turistas que chegaram ao Brasil por região em 2014.
Partindo arquivo de dados Tabulando o número de chegada por estados Usando a função aggregate
tabela_regiao=aggregate(cheg_2014~Regiao,
data=dados,
sum)
tabela_regiao
## Regiao cheg_2014
## 1 Centro Oeste 162062
## 2 Nordeste 346774
## 3 Norte 64845
## 4 Sudeste 3867986
## 5 Sul 1901692
## 6 Variados 86494
#Exercicio 2 2) Crie e edite um gráfico de barras com a chegadas de turistas em 2014 por região. Não esqueça de editar o gráfico.
Gráfico de barras
Partindo dos dados tabulados As categorias devem ser ordenadas
x=tabela_regiao$Regiao[order(tabela_regiao$cheg_2014,decreasing = F)]
y=sort(tabela_regiao$cheg_2014)/1000
w=(tabela_estados$cheg_2012)/1000 Use sort() quando quiser o vetor já organizado em si. Use order() quando precisar reorganizar linhas de um data frame ou trabalhar com os índices de ordenação.
gráfico
barplot(y,names.arg=x,
main="Chegadas de turistas no Brasil em 2012",
cex.main=1.0,
ylab= "Chegadas por mil",
cex.names=1,
axis.names= T, #Inclui o nome das categorias no eixo X
las=2
)
#Exercicio 3
3) Com os dados de Minas Gerais, crie um gráfico de linhas para os anos
de 2012 a 2015. Não esqueça de editar o gráfico.
Organizar os dados de SP em função dos meses
dados_MG=dados[dados$Estado=="MinasGerais",]
dados_MG
## Mes Estado cheg_2012 cheg_2013 cheg_2014 cheg_2015 C_Estado Regiao
## 61 1 MinasGerais 3604 2518 2117 2038 6 Sudeste
## 62 2 MinasGerais 4006 2733 2664 3453 6 Sudeste
## 63 3 MinasGerais 5752 3497 2155 4518 6 Sudeste
## 64 4 MinasGerais 3940 2827 2584 3559 6 Sudeste
## 65 5 MinasGerais 4225 2889 3331 4512 6 Sudeste
## 66 6 MinasGerais 6983 4840 18398 4370 6 Sudeste
## 67 7 MinasGerais 5969 10174 5122 5817 6 Sudeste
## 68 8 MinasGerais 4876 3910 3347 3922 6 Sudeste
## 69 9 MinasGerais 3590 2974 2210 1776 6 Sudeste
## 70 10 MinasGerais 3702 3255 2242 3348 6 Sudeste
## 71 11 MinasGerais 2991 3095 2414 3950 6 Sudeste
## 72 12 MinasGerais 4842 3927 4332 6666 6 Sudeste
Definindo os valores dos eixos
x=dados_MG$Mes
y1=dados_MG$cheg_2012/1000
y2=dados_MG$cheg_2013/1000
y3=dados_MG$cheg_2014/1000
y4=dados_MG$cheg_2015/1000
Definindo os limites do eixo y
li=min(y1,y2,y3,y4)
ls=max(y1,y2,y3,y4)
Gráfico
plot(x,y1,lty=1,lwd=1,type="b",ylim=c(0.8*li,ls*1.2),xlab= "Mês",
ylab= "Chegada por mil",col= "green")
lines(x,y2,lty=2,lwd=1,type="b", col= "purple") #Acresenta y2
lines(x,y3,lty=3,lwd=1,type="b", col= "red") #lty= tipo da linha
lines(x,y4,lty=4,lwd=1,type="b", col= "blue") #lwd= espessura da linha
title(main= "Chegada de turistas em Minas Gerais",
sub= "Fonte elaborada pelo autor",
cex.sub= 0.8
)
legend(10,20,
c("2012","2013","2014","2015"),
col= c("green", "purple", "red", "blue"),
lty=1:4,
cex=0.5
)
#Exercicio 4
4) Avalie a relação entre a chegadas de turista nos estados do Paraná e
no DF através de um gráfico de pontos. Chegada em 2015 Não esqueça de
editar o gráfico.
Gráficos de dispersão
dados_PR=dados[dados$Estado=="Parana",]
dados_DF=dados[dados$Estado=="DF",]
x=dados_PR$cheg_2015/1000
y=dados_DF$cheg_2015/1000
plot(x,y)
#Obtendo a correlação
cor(x,y)
## [1] 0.01670706
#Obtendo os coeficientes da reta de regressão
lm(y~x)$coef
## (Intercept) x
## 8.833123327 0.001594945
plot(x,y,
main= paste( "Grafico de dispersão entre chegadas de turistas em 2014",
"\n", "Parané x Distrito Federal"),
cex.main=1,
xlab="Chegadas de turistas no Paraná/1000",
ylab="Chegadas de turistas em Distrito federal/1000",
pch=16
)
abline(lm(y~x), lty=2, lwd=2) #adiciona a reta
text(130,13,"Equação da reta", cex=0.8)
text(130,11,paste("y =",eval(expression(round(lm(y~x)
$coef[[2]],2))), "x + ",eval(expression(round(lm(y~x)
$coef[[1]],2)))),cex=0.8)
#Exercicio 5
dados_reg=dados[dados$Regiao=="Norte",]
x= dados_reg$cheg_2013/1000
o gráfico
hist(x,
freq=T, #se T fornece a frequencia absoluta se F fornece a freqeuncia relativa
main= "Histograma da chegada dos turistas ao Brasil em 2012",
xlab= "Chegada dos turistas em 2012 por mil",
ylab= "Frequencia absoluta das chegadas",
ylim=c(0,12),
xlim=c(0,7)
)
#Exercício 6
6) Compare através de um boxplot a relação da chegada de turistas por
região no ano de 2015. Não esqueça de editar o gráfico.
x=dados$Regiao
y=dados$cheg_2015/1000
boxplot(y~x,
main= "Boxplot das chegadas de Turistas ao Brasil em 2015",
xlab= "Ano 2015",
ylab= "Chegadas de turistas em 2015 por mil",
)
#Exercício 7
7) Seu amigo lhe pediu para ajudá-lo a editar uma tabela de dados para
ser importado para o R. Organize e salve a tabela para que a mesma possa
ser importada para o programa. Atenção aos detalhes que conversamos
sobre como montar uma tabela para o R. Importe a mesma para o R e envie
a tabela corrigida junto com o script das atividades.
Resposta: Para corrigir os dados da tabela troque as virgulas por ponto nos dados das váriaveis quantitativas Retire todos os espaços nos nome das variáveis, use o _ Salve a tabela como .txt