#Lista 4 - Gráficos

##Importando o conjunto de dados

dados=read.csv2("https://raw.githubusercontent.com/Lucianea/Alta/master/turismo.csv",
                sep=",") #sep=, indica que o separador na tabela das colunas é uma ,

Observando os dados

head(dados)
##   Mes   Estado cheg_2012 cheg_2013 cheg_2014 cheg_2015 C_Estado Regiao
## 1   1 Amazonas      3717      4945      3581      4423        1  Norte
## 2   2 Amazonas      4048      3905      2915      3187        1  Norte
## 3   3 Amazonas      3581      2449      2797      3666        1  Norte
## 4   4 Amazonas      1914      1447      1474      3392        1  Norte
## 5   5 Amazonas      1567      2152      3225      3406        1  Norte
## 6   6 Amazonas      3237      2606     13309      4271        1  Norte
summary(dados)
##       Mes           Estado            cheg_2012        cheg_2013     
##  Min.   : 1.00   Length:180         Min.   :   780   Min.   :   617  
##  1st Qu.: 3.75   Class :character   1st Qu.:  3076   1st Qu.:  2951  
##  Median : 6.50   Mode  :character   Median :  5500   Median :  5708  
##  Mean   : 6.50                      Mean   : 31538   Mean   : 32296  
##  3rd Qu.: 9.25                      3rd Qu.: 40004   3rd Qu.: 40176  
##  Max.   :12.00                      Max.   :225960   Max.   :235714  
##    cheg_2014        cheg_2015         C_Estado     Regiao         
##  Min.   :   531   Min.   :   694   Min.   : 1   Length:180        
##  1st Qu.:  3333   1st Qu.:  3584   1st Qu.: 4   Class :character  
##  Median :  6050   Median :  6206   Median : 8   Mode  :character  
##  Mean   : 35721   Mean   : 35032   Mean   : 8                     
##  3rd Qu.: 39626   3rd Qu.: 29488   3rd Qu.:12                     
##  Max.   :352042   Max.   :405845   Max.   :15

#Exercicio 1 1) Usando a função aggregate crie uma tabela com o número de turistas que chegaram ao Brasil por região em 2014.

Partindo arquivo de dados Tabulando o número de chegada por estados Usando a função aggregate

tabela_regiao=aggregate(cheg_2014~Regiao, 
                         data=dados,
                         sum)

tabela_regiao
##         Regiao cheg_2014
## 1 Centro Oeste    162062
## 2     Nordeste    346774
## 3        Norte     64845
## 4      Sudeste   3867986
## 5          Sul   1901692
## 6     Variados     86494

#Exercicio 2 2) Crie e edite um gráfico de barras com a chegadas de turistas em 2014 por região. Não esqueça de editar o gráfico.

Gráfico de barras

Partindo dos dados tabulados As categorias devem ser ordenadas

x=tabela_regiao$Regiao[order(tabela_regiao$cheg_2014,decreasing = F)]

y=sort(tabela_regiao$cheg_2014)/1000

w=(tabela_estados$cheg_2012)/1000 Use sort() quando quiser o vetor já organizado em si. Use order() quando precisar reorganizar linhas de um data frame ou trabalhar com os índices de ordenação.

gráfico

barplot(y,names.arg=x,
        main="Chegadas de turistas no Brasil em 2012",
        cex.main=1.0,
        ylab= "Chegadas por mil",
        cex.names=1,
        axis.names= T,       #Inclui o nome das categorias no eixo X
        las=2
)

#Exercicio 3
3) Com os dados de Minas Gerais, crie um gráfico de linhas para os anos de 2012 a 2015. Não esqueça de editar o gráfico.

Organizar os dados de SP em função dos meses

dados_MG=dados[dados$Estado=="MinasGerais",]
    
    dados_MG
##    Mes      Estado cheg_2012 cheg_2013 cheg_2014 cheg_2015 C_Estado  Regiao
## 61   1 MinasGerais      3604      2518      2117      2038        6 Sudeste
## 62   2 MinasGerais      4006      2733      2664      3453        6 Sudeste
## 63   3 MinasGerais      5752      3497      2155      4518        6 Sudeste
## 64   4 MinasGerais      3940      2827      2584      3559        6 Sudeste
## 65   5 MinasGerais      4225      2889      3331      4512        6 Sudeste
## 66   6 MinasGerais      6983      4840     18398      4370        6 Sudeste
## 67   7 MinasGerais      5969     10174      5122      5817        6 Sudeste
## 68   8 MinasGerais      4876      3910      3347      3922        6 Sudeste
## 69   9 MinasGerais      3590      2974      2210      1776        6 Sudeste
## 70  10 MinasGerais      3702      3255      2242      3348        6 Sudeste
## 71  11 MinasGerais      2991      3095      2414      3950        6 Sudeste
## 72  12 MinasGerais      4842      3927      4332      6666        6 Sudeste

Definindo os valores dos eixos

x=dados_MG$Mes
y1=dados_MG$cheg_2012/1000
y2=dados_MG$cheg_2013/1000
y3=dados_MG$cheg_2014/1000
y4=dados_MG$cheg_2015/1000

Definindo os limites do eixo y

li=min(y1,y2,y3,y4)
ls=max(y1,y2,y3,y4)

Gráfico

plot(x,y1,lty=1,lwd=1,type="b",ylim=c(0.8*li,ls*1.2),xlab= "Mês",
         ylab= "Chegada por mil",col= "green")
    lines(x,y2,lty=2,lwd=1,type="b", col= "purple") #Acresenta y2
    lines(x,y3,lty=3,lwd=1,type="b", col= "red") #lty= tipo da linha
    lines(x,y4,lty=4,lwd=1,type="b", col= "blue") #lwd= espessura da linha
    
    title(main= "Chegada de turistas em Minas Gerais", 
          sub= "Fonte elaborada pelo autor",
          cex.sub= 0.8
    )
    
    legend(10,20,
           c("2012","2013","2014","2015"),
           col= c("green", "purple", "red", "blue"),
           lty=1:4, 
           cex=0.5
    )

#Exercicio 4
4) Avalie a relação entre a chegadas de turista nos estados do Paraná e no DF através de um gráfico de pontos. Chegada em 2015 Não esqueça de editar o gráfico.

Gráficos de dispersão

dados_PR=dados[dados$Estado=="Parana",]
dados_DF=dados[dados$Estado=="DF",]
x=dados_PR$cheg_2015/1000
y=dados_DF$cheg_2015/1000
 plot(x,y)

    #Obtendo a correlação
    cor(x,y)
## [1] 0.01670706
    #Obtendo os coeficientes da reta de regressão
    lm(y~x)$coef
## (Intercept)           x 
## 8.833123327 0.001594945
    plot(x,y,
         main= paste( "Grafico de dispersão entre chegadas de turistas em 2014",
                      "\n", "Parané x Distrito Federal"),
         cex.main=1,
         xlab="Chegadas de turistas no Paraná/1000",
         ylab="Chegadas de turistas em Distrito federal/1000",
         pch=16
    )
    
    abline(lm(y~x), lty=2, lwd=2) #adiciona a reta
    
    text(130,13,"Equação da reta", cex=0.8)
    
    text(130,11,paste("y =",eval(expression(round(lm(y~x)
                                                   $coef[[2]],2))), "x + ",eval(expression(round(lm(y~x)
                                                                                                 $coef[[1]],2)))),cex=0.8)

#Exercicio 5

  1. Crie um histograma, utilizando a função hist para avaliar a quantidade de turistas no ano de 2013 na região Norte. Não esqueça de editar o gráfico.
dados_reg=dados[dados$Regiao=="Norte",]

    x= dados_reg$cheg_2013/1000

o gráfico

hist(x,
         freq=T, #se T fornece a frequencia absoluta se F fornece a freqeuncia relativa
         main= "Histograma da chegada dos turistas ao Brasil em 2012",
         xlab= "Chegada dos turistas em 2012 por mil",
         ylab= "Frequencia absoluta das chegadas",
         ylim=c(0,12),
         xlim=c(0,7)
    )

#Exercício 6
6) Compare através de um boxplot a relação da chegada de turistas por região no ano de 2015. Não esqueça de editar o gráfico.

x=dados$Regiao
    
y=dados$cheg_2015/1000
 boxplot(y~x,
            main= "Boxplot das chegadas de Turistas ao Brasil em 2015",
            xlab= "Ano 2015",
            ylab= "Chegadas de turistas em 2015 por mil",
    )

#Exercício 7
7) Seu amigo lhe pediu para ajudá-lo a editar uma tabela de dados para ser importado para o R. Organize e salve a tabela para que a mesma possa ser importada para o programa. Atenção aos detalhes que conversamos sobre como montar uma tabela para o R. Importe a mesma para o R e envie a tabela corrigida junto com o script das atividades.

Resposta: Para corrigir os dados da tabela troque as virgulas por ponto nos dados das váriaveis quantitativas Retire todos os espaços nos nome das variáveis, use o _ Salve a tabela como .txt