Esse relatório tem como objetivo ajudar a administração do Parque Nacional de Yellowstone a dar uma experiencia melhor aos visitantes que gostariam de assistir a erupção de um dos maiores gêiseres do mundo, o Old Faithful. O parque tem o interesse em colocar uma sinalização avisando o tempo da próxima erupção, para isso será feito uma análise dos dados e uma interpretação análitica dos mesmos.
Erupção do gêiser Old Faithful no Paque Nacional de Yellowstone.
Os dados podem ser obtidos a partir do pacote MASS do software Estatístico R.
Abaixo temos inforamações gerais do banco de dados:
summary(geyser)
## waiting duration
## Min. : 43.00 Min. :0.8333
## 1st Qu.: 59.00 1st Qu.:2.0000
## Median : 76.00 Median :4.0000
## Mean : 72.31 Mean :3.4608
## 3rd Qu.: 83.00 3rd Qu.:4.3833
## Max. :108.00 Max. :5.4500
A partir disso, percebemos que a média do tempo de espera para ver a erupção do Gêiser é de 72.3143813 minutos. O tempo mínimo de espera é de 43 minutos e o maximo é de 108 minutos.
Vamos usar o boxplot pra mostrar a variação dos dados. A linha preta indica mediana dos dados (onde de encontra 50% da amostra ordenada). A linha abaixo da central indica o primeiro quartil (valor dos 25% da amostra ordenada) e a de cima indica o terceiro quartil (valor dos 75% da amostra ordenada).
boxplot(dados$waiting)
Analisando o boxplot do tempo de espera, podemos visualizar que os turistas costumam esperar entre 70 e 80 minutos para ver a erupção do gêiser. Entretando esses dados tem uma variação amostral de 13.890324 minutos.
boxplot(dados$duration)
Analisando o boxplot acima, verificamos que a erupção do gêiser dura em média 4 minutos, geralmente variando 1.1479037 minutos.
Outra forma de visualização é pelo gráfico de disperção abaixo. A partir deles notamos que, quando a erupção do gêiser ocorre em menor intervalo de tempo ele costuma ter uma duração maior. Enquanto que a maior parte dos dados está concentrado entre 70 e 90 minutos e neles o tempo de duração varia bastante.
ggplot(data = dados, aes(x=dados$waiting, y=dados$duration)) + geom_point(color = "cornflowerblue") + xlab("Tempo de espera") + ylab("Duração") + ggtitle("Gráfico de relação ") +theme_light()
Através da análise dos dados, podemos perceber que uma boa alternativa para o parque adotar seria implementar um painel eletronico mostrando que o turista deve chegar por voltar de 43 depois da ultima erupção para assistir uma erupção de em média 3.4608138 minutos.Se chegarem essa hora, provavelmente irão esperar 29.3143813 minutos mas o show é garantido.