Neste laboratório foram utilizados os seguintes bancos de dados: varnish.dat, guesswhat.dat e globtemp.dat. Tendo em vista que varnish.dat e guesswhat.datnão são séries temporais, então para eles, apenas serão apresentados os gráficos de comportamento e a correlação. Já para o banco de dados globtemp.dat, vão ser apresentados os gráficos de séries temporais que leva em consideração a temperatura ao longo do tempo.
varnish.txt, temos:## [1] -0.2528782
Análisando a variável X é possivel ver que os dados possuem um comportamento crescente, o que pode ser dado pelo fato das observações serem uma sequência numerica crescente que vai de 1 a 11. Fazendo o mesmo para a variável Y, nota-se que não seguido nenhum tipo de comportamento sequencial, mas pelo fato de ter poucas observações também não é possível admitir que se tem uma tendência desses dados.
Para investigar se as variáveis possuem algum tipo de correlação, foi feito um gráfico de dispersão entre X e Y, e a partir dele é possível notar que os pontos não são totalmente correlacionados e mostram-se distantes da reta estimada. Com Cor(X,Y) = -0.25, é possivel concluir que de fato as variáveis possuem uma leve correlação negativa.
guesswhat.txt## The following objects are masked from varnish:
##
## x, y
## [1] 0.06457764
Analisando a variável X não é possível observar que os dados apresentam uma espécie de agrupamento, formando três grupos com comportamentos diferentes entre si, mas não é possível admitir nenhum tipo de tendência ou se os dados seguem algum tipo de sequência. Quando se observa a variável Y, acontece algo semelhante ao que acontece com a variável X, mas apesar de possuir o mesmo agrupamento entre os dados o comportamento pode ser considerado diferente.
O gráfico de dispersão mostra que não há nenhum tipo de correlação entre as variáveis, onde os pontos apresentados não se aproximam da linha estimada, nem seguem nenhum tipo de comportamento. Com Cor(X,Y)=0.06, é possível concluir que realmente os dados não são correlacionados, pois a correlação entre as variáveis é quase igual a zero.
globtemp.txt##
## Call:
## lm(formula = inf ~ anos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.31231 -0.08627 0.00681 0.09064 0.36023
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -8.1870962 0.5323141 -15.38 <2e-16 ***
## anos 0.0041677 0.0002762 15.09 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.1349 on 140 degrees of freedom
## Multiple R-squared: 0.6192, Adjusted R-squared: 0.6164
## F-statistic: 227.6 on 1 and 140 DF, p-value: < 2.2e-16
##
## Call:
## lm(formula = x ~ t)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.30352 -0.09671 0.01132 0.08289 0.33519
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.219e+01 9.032e-01 -13.49 <2e-16 ***
## t 6.209e-03 4.635e-04 13.40 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.1298 on 96 degrees of freedom
## Multiple R-squared: 0.6515, Adjusted R-squared: 0.6479
## F-statistic: 179.5 on 1 and 96 DF, p-value: < 2.2e-16
##
## Call:
## lm(formula = y ~ tt)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.17557 -0.07987 -0.00706 0.06193 0.31489
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -4.129126 2.268986 -1.820 0.0759 .
## tt 0.002031 0.001208 1.681 0.1003
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.1018 on 42 degrees of freedom
## Multiple R-squared: 0.06301, Adjusted R-squared: 0.0407
## F-statistic: 2.824 on 1 and 42 DF, p-value: 0.1003
A partir desse banco de dados tem-se uma série, que compara a temperatura ao longo dos anos, variando entre os anos de 1856 a 1997. Pelo fato de ser uma série temporal é possível separar os dados em anos para fazer as análises de tendência, com isso serão feitos os estudos utilizando o período inicial (de 1856 a 1997), o período que vai de 1856 a 1899 e o período de 1900 a 1997.
Quando a série é avaliada apenas entre o período de 1856 e 1899, é possível considera-lá como sendo uma série estacionaria pelo fato de apresentar seus valores em torno da reta delimitada.
Quando a série é avaliada entre o período de 1900 e 1997 já é possivel notar uma tendência nos dados observados, o que de fato é mostrado através do ajuste do modelo de regressão, sendo o oposto do primeiro modelo ajustado, onde os coeficientes apresentavam valores iguais a zero, implicando que não havia tendência.
Através dos gráficos de ACF, é notável que entre os anos de 1900 e 1997 há um comportamento decrescente nas autocorrelações amostrais, como esse decrescimento acontece de uma maneira considerada lenta, é possível concluir de fato que a série possui uma maior tendência.
Já o gráfico de ACF para os anos de 1856 a 1899, é possivel ver que o valor das autocorrelações amostrais assumem valor nulo em grande parte dos lags, assumindo assim que não há presença de tendência nesse período, o que é de fato interessante pois, dado esse comportamento é possível associar essa série a um ruído branco.