Análise do tempo de espera do Gêiser

Esse relatório tem como objetivo ajudar a administração do Parque Nacional de Yellowstone a dar uma experiencia melhor aos visitantes que gostariam de assistir a erupção de um dos maiores gêiseres do mundo, o Old Faithful. O parque tem o interesse em colocar uma sinalização avisando o tempo da próxima erupção, para isso será feito uma análise dos dados e uma interpretação análitica dos mesmos.

Erupção do gêiser Old Faithful no Paque Nacional de Yellowstone.

Erupção do gêiser Old Faithful no Paque Nacional de Yellowstone.

Base de dados

Os dados podem ser obtidos a partir do pacote MASS do software Estatístico R.

Abaixo temos inforamações gerais do banco de dados:

summary(geyser)
##     waiting          duration     
##  Min.   : 43.00   Min.   :0.8333  
##  1st Qu.: 59.00   1st Qu.:2.0000  
##  Median : 76.00   Median :4.0000  
##  Mean   : 72.31   Mean   :3.4608  
##  3rd Qu.: 83.00   3rd Qu.:4.3833  
##  Max.   :108.00   Max.   :5.4500

A partir disso, percebemos que a média do tempo de espera para ver a erupção do Gêiser é de 72.3143813 minutos. O tempo mínimo de espera é de 43 minutos e o maximo é de 108 minutos.

Visualização dos dados

Dados de Espera

Vamos usar o boxplot pra mostrar a variação dos dados. A linha preta indica mediana dos dados (onde de encontra 50% da amostra ordenada). A linha abaixo da central indica o primeiro quartil (valor dos 25% da amostra ordenada) e a de cima indica o terceiro quartil (valor dos 75% da amostra ordenada).

boxplot(dados$waiting)

Analisando o boxplot do tempo de espera, podemos visualizar que os turistas costumam esperar entre 70 e 80 minutos para ver a erupção do gêiser. Entretando esses dados tem uma variação amostral de 13.890324 minutos.

Dados de Duração

boxplot(dados$duration)

Analisando o boxplot acima, verificamos que a erupção do gêiser dura em média 4 minutos, geralmente variando 1.1479037 minutos.

Visualização dos dados [2]

Outra forma de visualização é pelo gráfico de disperção abaixo. A partir deles notamos que, quando a erupção do gêiser ocorre em menor intervalo de tempo ele costuma ter uma duração maior. Enquanto que a maior parte dos dados está concentrado entre 70 e 90 minutos e neles o tempo de duração varia bastante.

ggplot(data = dados, aes(x=dados$waiting, y=dados$duration)) + geom_point(color = "cornflowerblue") + xlab("Tempo de espera") + ylab("Duração") + ggtitle("Gráfico de relação ") +theme_light()

Conclusão

Através da análise dos dados, podemos perceber que uma boa alternativa para o parque adotar seria implementar um painel eletronico mostrando que o turista deve chegar por voltar de 43 depois da ultima erupção para assistir uma erupção de em média 3.4608138 minutos.Se chegarem essa hora, provavelmente irão esperar 29.3143813 minutos mas o show é garantido.