EXAM I

library(fpp3)

## Warning in system("timedatectl", intern = TRUE): running command 'timedatectl'
## had status 1

## Registered S3 method overwritten by 'tsibble':
##   method               from 
##   as_tibble.grouped_df dplyr

## ── Attaching packages ──────────────────────────────────────────── fpp3 1.0.1 ──

## ✔ tibble      3.1.8     ✔ tsibble     1.1.5
## ✔ dplyr       1.1.0     ✔ tsibbledata 0.4.1
## ✔ tidyr       1.3.0     ✔ feasts      0.4.1
## ✔ lubridate   1.9.2     ✔ fable       0.4.0
## ✔ ggplot2     3.5.1

## ── Conflicts ───────────────────────────────────────────────── fpp3_conflicts ──
## ✖ lubridate::date()    masks base::date()
## ✖ dplyr::filter()      masks stats::filter()
## ✖ tsibble::intersect() masks base::intersect()
## ✖ tsibble::interval()  masks lubridate::interval()
## ✖ dplyr::lag()         masks stats::lag()
## ✖ tsibble::setdiff()   masks base::setdiff()
## ✖ tsibble::union()     masks base::union()

library(tidyverse)

## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats 1.0.0     ✔ readr   2.1.4
## ✔ purrr   1.0.1     ✔ stringr 1.5.0

## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter()     masks stats::filter()
## ✖ tsibble::interval() masks lubridate::interval()
## ✖ dplyr::lag()        masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors

pacman::p_load(tidyverse, fpp3)
pacman::p_load(dplyr, ggplot2) 
Sys.time()

## [1] "2024-11-03 23:13:10 EST"

1.

Consider the GDP information in data set called global_economy, which is already embedded in fpp3 package (no need to upload externally)

1. Choose a random country by yourself. Then plot the GDP per capita for this country over time? How GDP per capita has changed over time for the series you chose? Explain briefly.

global_economy # see the data.

## # A tsibble: 15,150 x 9 [1Y]
## # Key:       Country [263]
##    Country     Code   Year         GDP Growth   CPI Imports Exports Population
##    <fct>       <fct> <dbl>       <dbl>  <dbl> <dbl>   <dbl>   <dbl>      <dbl>
##  1 Afghanistan AFG    1960  537777811.     NA    NA    7.02    4.13    8996351
##  2 Afghanistan AFG    1961  548888896.     NA    NA    8.10    4.45    9166764
##  3 Afghanistan AFG    1962  546666678.     NA    NA    9.35    4.88    9345868
##  4 Afghanistan AFG    1963  751111191.     NA    NA   16.9     9.17    9533954
##  5 Afghanistan AFG    1964  800000044.     NA    NA   18.1     8.89    9731361
##  6 Afghanistan AFG    1965 1006666638.     NA    NA   21.4    11.3     9938414
##  7 Afghanistan AFG    1966 1399999967.     NA    NA   18.6     8.57   10152331
##  8 Afghanistan AFG    1967 1673333418.     NA    NA   14.2     6.77   10372630
##  9 Afghanistan AFG    1968 1373333367.     NA    NA   15.2     8.90   10604346
## 10 Afghanistan AFG    1969 1408888922.     NA    NA   15.0    10.1    10854428
## # … with 15,140 more rows

# 1.Answer:
global_economy %>%
 filter(Code == "ITA")%>% mutate(GDPpc = (GDP/Population)) %>% autoplot(GDPpc)

2.

For each of the following series, make a graph of the data. If transforming seems appropriate, do so and describe the effect. Comment below in answer:

2a. Use the series you chose in #1.

# 2a.Answer:
Italy = global_economy %>% filter(Country == "Italy") %>% mutate(GDPpc = (GDP/Population))

Italy %>% features(GDPpc, features = guerrero) # the lamda is 0, so use 0 in box-cox transformation

## # A tibble: 1 × 2
##   Country lambda_guerrero
##   <fct>             <dbl>
## 1 Italy           -0.0656

Italy %>% autoplot(box_cox(GDPpc, 0))

2b.

United States GDP from global_economy.

# 2b.Answer:
us_economy <- global_economy %>%
 filter(Country == "United States")
us_economy %>%
 autoplot(box_cox(GDP, 0))

us_economy %>%
 autoplot(box_cox(GDP, 0.3))

us_economy %>%
 features(GDP, features = guerrero)

## # A tibble: 1 × 2
##   Country       lambda_guerrero
##   <fct>                   <dbl>
## 1 United States           0.282

us_economy %>%
 autoplot(box_cox(GDP, 0.2819714))

2c.

Slaughter of Victorian “Bulls, bullocks and steers” in aus_livestock

# 2c.Answer:

vic_bulls <- aus_livestock %>% filter(State == "Victoria", Animal == "Bulls, bullocks and steers")
vic_bulls %>%
 autoplot(Count)

vic_bulls %>%
 features(Count, features = guerrero)

## # A tibble: 1 × 3
##   Animal                     State    lambda_guerrero
##   <fct>                      <fct>              <dbl>
## 1 Bulls, bullocks and steers Victoria         -0.0446

2d.

Victorian Electricity Demand from vic_elec.

# 2d.Answer:
vic_elec %>%
 autoplot(box_cox(Demand, 0))

2e.

Gas production from aus_production.

# 2e.Answer:
aus_production %>%
 autoplot(Gas)

aus_production %>%
 autoplot(box_cox(Gas, 0))

aus_production %>%
 features(Gas, features = guerrero)

## # A tibble: 1 × 1
##   lambda_guerrero
##             <dbl>
## 1           0.110

aus_production %>%
 autoplot(box_cox(Gas, 0.1095))

3. Use the canadian_gas data (monthly Canadian gas production in billions of cubic metres, January 1960 – February 2005).

2a. Plot the data using autoplot(), gg_subseries() , gg_season() to look at the effect of the changing seasonality over time. Describe the graphs in your own words. What do you see? What type pf pattern do you observe?

# 3a.Answer:
canadian_gas %>% autoplot(Volume)

canadian_gas %>% gg_subseries(Volume)

canadian_gas %>% gg_season(Volume)

3b.

Do an STL decomposition of the data. You will need to choose a seasonal window to allow for the changing shape of the seasonal component.

# 3b.Answer:
# STL model:
fit <- canadian_gas %>%
 model(STL(Volume)) %>%
 components()

fit

## # A dable: 542 x 7 [1M]
## # Key:     .model [1]
## # :        Volume = trend + season_year + remainder
##    .model         Month Volume trend season_year remainder season_adjust
##    <chr>          <mth>  <dbl> <dbl>       <dbl>     <dbl>         <dbl>
##  1 STL(Volume) 1960 Jan  1.43   1.08      0.520   -0.172           0.911
##  2 STL(Volume) 1960 Feb  1.31   1.11      0.215   -0.0178          1.09 
##  3 STL(Volume) 1960 Mar  1.40   1.13      0.307   -0.0395          1.09 
##  4 STL(Volume) 1960 Apr  1.17   1.16      0.0161  -0.00627         1.15 
##  5 STL(Volume) 1960 May  1.12   1.18     -0.116    0.0476          1.23 
##  6 STL(Volume) 1960 Jun  1.01   1.21     -0.356    0.159           1.37 
##  7 STL(Volume) 1960 Jul  0.966  1.23     -0.403    0.136           1.37 
##  8 STL(Volume) 1960 Aug  0.977  1.26     -0.349    0.0677          1.33 
##  9 STL(Volume) 1960 Sep  1.03   1.28     -0.340    0.0870          1.37 
## 10 STL(Volume) 1960 Oct  1.25   1.31     -0.0899   0.0329          1.34 
## # … with 532 more rows

names(fit)

## [1] ".model"        "Month"         "Volume"        "trend"        
## [5] "season_year"   "remainder"     "season_adjust"

fit %>% autoplot()

3c.

How does the seasonal shape change over time? [Hint: Try plotting the seasonal component using gg_season().]

# 3c.Answer:
fit %>% gg_season(season_year)

3d.

produce a plausible seasonally adjusted series? What are these numbers, plot the series.

# 3d.Answer:
SeasonallyAdj <- fit$season_adjust # seasonally adjusted series.
#  original series:
canadian_gas %>%
 autoplot(Volume) +
 autolayer(fit, season_adjust, col = "blue")

4.

For retail time series, use the below code:

# run the code
set.seed(12345678)

myseries <- aus_retail %>%
  filter(`Series ID` == sample(aus_retail$`Series ID`,1))

head(myseries,2)

## # A tsibble: 2 x 5 [1M]
## # Key:       State, Industry [1]
##   State              Industry                           Serie…¹    Month Turno…²
##   <chr>              <chr>                              <chr>      <mth>   <dbl>
## 1 Northern Territory Clothing, footwear and personal a… A33497… 1988 Apr     2.3
## 2 Northern Territory Clothing, footwear and personal a… A33497… 1988 May     2.9
## # … with abbreviated variable names ¹`Series ID`, ²Turnover

4a.

Create a training dataset consisting of observations before 2011

myseries_train <- myseries %>%
  filter(year(Month) < 2011)

4b.

Check that your data have been split appropriately by producing the following plot.

autoplot(myseries, Turnover) +
  autolayer(myseries_train, Turnover, colour = "red")

4c.

Fit a seasonal naïve model using SNAIVE() applied to your training data (myseries_train).

 #Answer:
    fit <- myseries_train %>%
      model(SNAIVE(Turnover))

4d.

Check the residuals.

# 4d Answer:
fit %>% gg_tsresiduals()

## Warning: Removed 12 rows containing missing values or values outside the scale range
## (`geom_line()`).

## Warning: Removed 12 rows containing missing values or values outside the scale range
## (`geom_point()`).

## Warning: Removed 12 rows containing non-finite outside the scale range
## (`stat_bin()`).

# Do the residuals appear to be uncorrelated and normally distributed?
# Answ: yes, normally distributed.

4e.

Produce forecasts for the test data with given code below:

# 4e Answer:
fc <- fit %>%  
forecast(new_data = anti_join(myseries, myseries_train))

## Joining with `by = join_by(State, Industry, `Series ID`, Month, Turnover)`

fc %>% autoplot(myseries)

Joining by = c(“State”, “Industry”, “Series ID”, “Month”, “Turnover”)

4f.

Compare the accuracy of your forecasts against the actual values with given code below:

fit %>% accuracy()

## # A tibble: 1 × 12
##   State     Indus…¹ .model .type    ME  RMSE   MAE   MPE  MAPE  MASE RMSSE  ACF1
##   <chr>     <chr>   <chr>  <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Northern… Clothi… SNAIV… Trai… 0.439  1.21 0.915  5.23  12.4     1     1 0.768
## # … with abbreviated variable name ¹Industry

fc %>% accuracy(myseries)

## # A tibble: 1 × 12
##   .model     State Indus…¹ .type    ME  RMSE   MAE   MPE  MAPE  MASE RMSSE  ACF1
##   <chr>      <chr> <chr>   <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 SNAIVE(Tu… Nort… Clothi… Test  0.836  1.55  1.24  5.94  9.06  1.36  1.28 0.601
## # … with abbreviated variable name ¹Industry

# 4f Answ:RMSE is lower in first series, as 1.21, and RMSE is 1.55 in myseries.

4g.

How sensitive are the accuracy measures to the amount of training data used?

# 4g Answer:
#The RMSE values are 1.21 and 1.55, indicating some sensitivity. The model performs much better on the training data compared to the out-of-sample data. This difference is common and, in this case, is noticeable because the model hasn’t captured the trend in the data. This is clear from the mean error being above zero, showing that the predictions are falling short of the actual upward trend in the data.

5.

5a.

Create a training set for Australian takeaway food turnover (aus_retail) by withholding the last four years as a test set.

# 5a.Answer:
takeaway <- aus_retail %>%
 filter(Industry == "Takeaway food services") %>%
 summarise(Turnover = sum(Turnover))

train <- takeaway %>%
 filter(year(Month) <= 2014)

tail(train)

## # A tsibble: 6 x 2 [1M]
##      Month Turnover
##      <mth>    <dbl>
## 1 2014 Jul    1328.
## 2 2014 Aug    1335.
## 3 2014 Sep    1338.
## 4 2014 Oct    1390.
## 5 2014 Nov    1391.
## 6 2014 Dec    1494.

5b.

Fit all the appropriate benchmark methods to the training set and forecast the periods covered by the test set.

# 5b.Answer:

fit <- train %>%
 model(
 naive = NAIVE(Turnover),
 drift = RW(Turnover ~ drift()),
 mean = MEAN(Turnover),
 snaive = SNAIVE(Turnover)
 )


fc <- fit %>% forecast(h = "4 years")

5c.

Compute the accuracy of your forecasts. Which method does best?

# 5c.Answer:


fc %>%
 accuracy(takeaway) %>%
 arrange(MASE)

## # A tibble: 4 × 10
##   .model .type    ME  RMSE   MAE   MPE  MAPE  MASE RMSSE  ACF1
##   <chr>  <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 naive  Test  -12.4  119.  96.4 -1.49  6.66  2.30  2.25 0.613
## 2 drift  Test  -93.7  130. 108.  -6.82  7.67  2.58  2.46 0.403
## 3 snaive Test  177.   192. 177.  11.7  11.7   4.22  3.64 0.902
## 4 mean   Test  829.   838. 829.  55.7  55.7  19.8  15.8  0.613

#The naive method is best here according to MASE value. It's minimum at naive.

5d.

Do the residuals from the best method resemble white noise?

# 5d.Answer:
fit %>%
 select(naive) %>%
 gg_tsresiduals()

## Warning: Removed 1 row containing missing values or values outside the scale range
## (`geom_line()`).

## Warning: Removed 1 row containing missing values or values outside the scale range
## (`geom_point()`).

## Warning: Removed 1 row containing non-finite outside the scale range
## (`stat_bin()`).

# This is far from white noise. There is strong seasonality and increasing variance that has not been accounted for by the naive model.
# look at the acf values, it has peak at different lags, showing seasonality.

6.

Using the code below, get a series (it gets a series randomly by using sample() function):

set.seed(12345678)
myseries <- aus_retail %>%
  filter(`Series ID` == sample(aus_retail$`Series ID`,1))

see head of your series to check it is a tsibble data, and remove NA’s if there is any with these commands:

head(myseries)

## # A tsibble: 6 x 5 [1M]
## # Key:       State, Industry [1]
##   State              Industry                           Serie…¹    Month Turno…²
##   <chr>              <chr>                              <chr>      <mth>   <dbl>
## 1 Northern Territory Clothing, footwear and personal a… A33497… 1988 Apr     2.3
## 2 Northern Territory Clothing, footwear and personal a… A33497… 1988 May     2.9
## 3 Northern Territory Clothing, footwear and personal a… A33497… 1988 Jun     2.6
## 4 Northern Territory Clothing, footwear and personal a… A33497… 1988 Jul     2.8
## 5 Northern Territory Clothing, footwear and personal a… A33497… 1988 Aug     2.9
## 6 Northern Territory Clothing, footwear and personal a… A33497… 1988 Sep     3  
## # … with abbreviated variable names ¹`Series ID`, ²Turnover

myseries =  myseries %>% filter(!is.na(`Series ID`))

6a.

What is the name of the series you randomly choose? Write it.

# 6a.Answer:
# It is A3349767W .

6b.

Run a linear regression of Turnover on trend.(Hint: use TSLM() and trend() functions)

# 6b.Answer:

fit = myseries %>% model(TSLM(Turnover~ trend()))

6c.

See the regression result by report() command.

# 6c.Answer:
report(fit)

## Series: Turnover 
## Model: TSLM 
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.0795 -1.1704 -0.1640  0.9683  7.4514 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 3.5313376  0.1983464   17.80   <2e-16 ***
## trend()     0.0307747  0.0009291   33.12   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.901 on 367 degrees of freedom
## Multiple R-squared: 0.7493,  Adjusted R-squared: 0.7486
## F-statistic:  1097 on 1 and 367 DF, p-value: < 2.22e-16

6d.

By using this model, forecast it for the next 3 years. What are the values of the next 3 years, monthly values?

# 6d.Answer:


fit %>% forecast(h=36)

## # A fable: 36 x 6 [1M]
## # Key:     State, Industry, .model [1]
##    State              Industry                                   .model    Month
##    <chr>              <chr>                                      <chr>     <mth>
##  1 Northern Territory Clothing, footwear and personal accessory… TSLM(… 2019 Jan
##  2 Northern Territory Clothing, footwear and personal accessory… TSLM(… 2019 Feb
##  3 Northern Territory Clothing, footwear and personal accessory… TSLM(… 2019 Mar
##  4 Northern Territory Clothing, footwear and personal accessory… TSLM(… 2019 Apr
##  5 Northern Territory Clothing, footwear and personal accessory… TSLM(… 2019 May
##  6 Northern Territory Clothing, footwear and personal accessory… TSLM(… 2019 Jun
##  7 Northern Territory Clothing, footwear and personal accessory… TSLM(… 2019 Jul
##  8 Northern Territory Clothing, footwear and personal accessory… TSLM(… 2019 Aug
##  9 Northern Territory Clothing, footwear and personal accessory… TSLM(… 2019 Sep
## 10 Northern Territory Clothing, footwear and personal accessory… TSLM(… 2019 Oct
## # … with 26 more rows, and 2 more variables: Turnover <dist>, .mean <dbl>

6d.

Plot the forecast values along with the original data.

# 6d.Answer:
fit %>% forecast(h=36 )%>% autoplot(myseries)

fit %>% forecast(h=36 )%>% autoplot()

6e.

Get the residuals from the model. And check the residuals to check whether or not it satisfies the requirements for white noise error terms.(hint: augment() and gg_tsresiduals() functions)

# 6e.Answer:


 fit %>% gg_tsresiduals()

7.

Half-hourly electricity demand for Victoria, Australia is contained in vic_elec. Extract the January 2014 electricity demand, and aggregate this data to daily with daily total demands and maximum temperatures. Run the code below:

jan_vic_elec <- vic_elec %>%
  filter(yearmonth(Time) == yearmonth("2014 Jan")) %>%
  index_by(Date = as_date(Time)) %>%
  summarise(Demand = sum(Demand), Temperature = max(Temperature))

7a.

Plot the data and find the regression model for Demand with temperature as a predictor variable. Why is there a positive relationship?

# 7a.Answer:
jan_vic_elec %>%
 ggplot(aes(x = Temperature, y = Demand)) +
 geom_point()

fit <- jan_vic_elec %>%
 model(TSLM(Demand ~ Temperature))

 fit %>% report()

## Series: Demand 
## Model: TSLM 
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -49978.2 -10218.9   -121.3  18533.2  35440.6 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  59083.9    17424.8   3.391  0.00203 ** 
## Temperature   6154.3      601.3  10.235 3.89e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 24540 on 29 degrees of freedom
## Multiple R-squared: 0.7832,  Adjusted R-squared: 0.7757
## F-statistic: 104.7 on 1 and 29 DF, p-value: 3.8897e-11

7b.

Produce a residual plot. Is the model adequate? Are there any outliers or influential observations?

# 7b.Answer:
fit %>% gg_tsresiduals()

#The residuals from this section of the data suggest that the model is lacking a trend (although looking at a larger window of the data, this is clearly not a real pattern). Some large variability suggests that there are some outliers in this data.

7c.

Use the model to forecast the electricity demand that you would expect for the next day if the maximum temperature was 15∘C and compare it with the forecast if the with maximum temperature was 35∘C. Do you believe these forecasts?

# 7c.Answer:
Next_Day <- scenarios(
  Coldday = new_data(jan_vic_elec, 1) %>% mutate(Temperature = 15),
  Hotday = new_data(jan_vic_elec, 1) %>% mutate(Temperature = 35)
)

fc <- fit %>%
  forecast(new_data = Next_Day) 


autoplot(jan_vic_elec, Demand) +
  autolayer(fc, series = "Forecast", PI = TRUE, alpha = 0.5) + 
  labs(title = "Demand Forecast for electricity",
       x = "Date",
       y = "Demand")

## Warning in ggdist::geom_interval(intvl_mapping, data =
## dist_qi_frame(object[single_row[["TRUE"]], : Ignoring unknown parameters:
## `series` and `PI`

## Warning in ggplot2::geom_point(mapping = without(mapping, "linetype"), data =
## unpack_data(object[single_row[["TRUE"]], : Ignoring unknown parameters:
## `series` and `PI`

jan_vic_elec %>%
 model(TSLM(Demand ~ Temperature)) %>%
 forecast(
 new_data(jan_vic_elec, 1) %>%
 mutate(Temperature = 15)
 ) %>%
 autoplot(jan_vic_elec)

#The forecasts seem reasonable. However we should be aware that there is not much data to support the forecasts at these temperature extremes, especially in that no daily maximum below 20∘C
#is observed during January (a summer month in Victoria).

7d.

Do you believe these forecasts? The following R code will get you started:

# 7d.Answer:
 jan_vic_elec %>%
 model(TSLM(Demand ~ Temperature)) %>%
 forecast(new_data(jan_vic_elec, 1) %>%
 mutate(Temperature = 15)
 ) %>%

 autoplot(jan_vic_elec)

7e.

Give prediction intervals for your forecasts.

# 7e.Answer:
fc %>%
 hilo(95) %>%
 select(-.model)

## # A tsibble: 2 x 6 [1D]
## # Key:       .scenario [2]
##   .scenario Date      
##   <chr>     <date>    
## 1 Coldday   2014-02-01
## 2 Hotday    2014-02-01
## # … with 4 more variables: Demand <dist>, .mean <dbl>, Temperature <dbl>,
## #   `95%` <hilo>

8.

Read the shampoo data given in excel (Import Dataset as Excel)

# a.    View the shampoo sales data. How many variables are there? Find how many rows and column in the data?
library(readxl)
shampoo_2 <- read_excel("shampoo-2.xlsx")

#b. Is the data annual, monthly, quarterly?
   str(shampoo_2) #data frame

## tibble [36 × 2] (S3: tbl_df/tbl/data.frame)
##  $ Month: POSIXct[1:36], format: "1995-01-01" "1995-02-01" ...
##  $ sales: num [1:36] 266 146 183 119 180 ...

   # Answ: Monthly data
#c. Convert the data into tibble , then tsibble 
 mydata = shampoo_2 %>%
 mutate(MONTHLY = yearmonth(Month)) %>% as_tsibble(index = MONTHLY) %>% select(-Month)
str(mydata)

## tbl_ts [36 × 2] (S3: tbl_ts/tbl_df/tbl/data.frame)
##  $ sales  : num [1:36] 266 146 183 119 180 ...
##  $ MONTHLY: mth [1:36] 1995 Jan, 1995 Feb, 1995 Mar, 1995 Apr, 1995 May, 1995 Jun,...
##  - attr(*, "key")= tibble [1 × 1] (S3: tbl_df/tbl/data.frame)
##   ..$ .rows: list<int> [1:1] 
##   .. ..$ : int [1:36] 1 2 3 4 5 6 7 8 9 10 ...
##   .. ..@ ptype: int(0) 
##  - attr(*, "index")= chr "MONTHLY"
##   ..- attr(*, "ordered")= logi TRUE
##  - attr(*, "index2")= chr "MONTHLY"
##  - attr(*, "interval")= interval [1:1] 1M
##   ..@ .regular: logi TRUE

mydata

## # A tsibble: 36 x 2 [1M]
##    sales  MONTHLY
##    <dbl>    <mth>
##  1  266  1995 Jan
##  2  146. 1995 Feb
##  3  183. 1995 Mar
##  4  119. 1995 Apr
##  5  180. 1995 May
##  6  168. 1995 Jun
##  7  232. 1995 Jul
##  8  224. 1995 Aug
##  9  193. 1995 Sep
## 10  123. 1995 Oct
## # … with 26 more rows

#d. Plot the shampoo sales. What do you see from the data pattern? What does x-axis represent? 
plot(shampoo_2$sales, type ="l")

mydata %>%
 autoplot(sales) +
 labs(title = "Monthly Shampoo Sales", y= "in $")

# Comment here. Use plot() and autoplot().Put the name for y axis, and a title for the graph.
  
#e. What is the average, and median of shampoo sales. Put it on a histogram.
  meanSales = mean(shampoo_2$sales)
meanSales

## [1] 312.6

median(shampoo_2$sales)

## [1] 280.15

hist(shampoo_2$sales)

mydata %>%
 ggplot(aes(x=sales)) +
 geom_histogram(bin=10)

## Warning in geom_histogram(bin = 10): Ignoring unknown parameters: `bin`

## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

#f. Get seasonal plot. What do you see/ is there any pattern, is there any seasonality.
  
mydata %>% gg_season(sales) # yes, there is a trend. 1997 is higher than 1996 and than 1995.

mydata %>% gg_subseries(sales) # it looks like there is monthly effect. it is higher in jul-december interval.

#g. Get a linear regression line with trend and dummy for each month (Hint: use trend and season in regression equation).
  
fit = mydata %>% model(TSLM(sales ~ trend() + season()))

#h. Comment on each estimated coefficient of the model.Are they statistically significant at 5 % significance level?

report(fit)

## Series: sales 
## Model: TSLM 
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -129.60  -62.32   -4.84   53.76  152.72 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)     113.867     55.740   2.043   0.0527 .  
## trend()          11.754      1.534   7.664 8.88e-08 ***
## season()year2   -33.154     73.630  -0.450   0.6567    
## season()year3   -53.808     73.678  -0.730   0.4726    
## season()year4   -24.628     73.757  -0.334   0.7415    
## season()year5   -56.015     73.869  -0.758   0.4560    
## season()year6   -27.802     74.012  -0.376   0.7106    
## season()year7     7.244     74.187   0.098   0.9231    
## season()year8   -37.043     74.393  -0.498   0.6233    
## season()year9    27.536     74.629   0.369   0.7155    
## season()year10  -32.518     74.897  -0.434   0.6682    
## season()year11    9.895     75.194   0.132   0.8964    
## season()year12   -4.259     75.522  -0.056   0.9555    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 90.16 on 23 degrees of freedom
## Multiple R-squared: 0.7592,  Adjusted R-squared: 0.6336
## F-statistic: 6.043 on 12 and 23 DF, p-value: 0.00011612

# Answ: no it is not significant. no monthly effect, but trend is statistically significant at 5 %.
  
#i. Which month has the highest sales?
   # december and november.

#j. Forecast it for the next year. What are the values
  forecasts = fit %>% forecast(h=12)
forecasts

## # A fable: 12 x 4 [1M]
## # Key:     .model [1]
##    .model                            MONTHLY
##    <chr>                               <mth>
##  1 TSLM(sales ~ trend() + season()) 1998 Jan
##  2 TSLM(sales ~ trend() + season()) 1998 Feb
##  3 TSLM(sales ~ trend() + season()) 1998 Mar
##  4 TSLM(sales ~ trend() + season()) 1998 Apr
##  5 TSLM(sales ~ trend() + season()) 1998 May
##  6 TSLM(sales ~ trend() + season()) 1998 Jun
##  7 TSLM(sales ~ trend() + season()) 1998 Jul
##  8 TSLM(sales ~ trend() + season()) 1998 Aug
##  9 TSLM(sales ~ trend() + season()) 1998 Sep
## 10 TSLM(sales ~ trend() + season()) 1998 Oct
## 11 TSLM(sales ~ trend() + season()) 1998 Nov
## 12 TSLM(sales ~ trend() + season()) 1998 Dec
## # … with 2 more variables: sales <dist>, .mean <dbl>

#k. Plot the forecast with original data.
  fit %>% forecast(h=12) %>% autoplot(mydata)

  forecasts %>% autoplot(mydata)

#l. Check if the residuals of the model is white noise.
  fit %>% gg_tsresiduals

  # it is autocorrelation at 1 lag.
 ### Answ: not white noise.
  
#m By using the regression model, check the accuracy of the forecast. What is MSE, RMSE values?
  accuracy(fit)

## # A tibble: 1 × 10
##   .model             .type        ME  RMSE   MAE   MPE  MAPE  MASE RMSSE    ACF1
##   <chr>              <chr>     <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>   <dbl>
## 1 TSLM(sales ~ tren… Trai… -3.99e-16  72.1  59.6 -4.55  23.1 0.388 0.378 -0.0363

LS0tCnRpdGxlOiAiRVhBTSBJIgphdXRob3I6IE5hbWJ1cnUgVmVua2F0YSBTYWkgUGhhbmluZHJhICBhbmQgdmFubWIzQHVuaC5uZXdoYXZlbi5lZHUKZGF0ZTogImByIFN5cy5EYXRlKClgIgpvdXRwdXQ6IG9wZW5pbnRybzo6bGFiX3JlcG9ydAogIAotLS0KCmBgYHtyIHNldHVwLCBpbmNsdWRlPUZBTFNFfQprbml0cjo6b3B0c19jaHVuayRzZXQoZWNobyA9IFRSVUUpCgpgYGAKCgpgYGB7cn0KbGlicmFyeShmcHAzKQpsaWJyYXJ5KHRpZHl2ZXJzZSkKcGFjbWFuOjpwX2xvYWQodGlkeXZlcnNlLCBmcHAzKQpwYWNtYW46OnBfbG9hZChkcGx5ciwgZ2dwbG90MikgClN5cy50aW1lKCkKYGBgCgojIyMgMS4JCkNvbnNpZGVyIHRoZSBHRFAgaW5mb3JtYXRpb24gaW4gZGF0YSBzZXQgY2FsbGVkIGdsb2JhbF9lY29ub215LCB3aGljaCBpcyBhbHJlYWR5IGVtYmVkZGVkIGluIGZwcDMgcGFja2FnZSAobm8gbmVlZCB0byB1cGxvYWQgZXh0ZXJuYWxseSkgCgojIyMgMS4JQ2hvb3NlIGEgcmFuZG9tIGNvdW50cnkgYnkgeW91cnNlbGYuIFRoZW4gcGxvdCB0aGUgR0RQIHBlciBjYXBpdGEgZm9yIHRoaXMgY291bnRyeSBvdmVyIHRpbWU/IEhvdyBHRFAgcGVyIGNhcGl0YSBoYXMgY2hhbmdlZCBvdmVyIHRpbWUgZm9yIHRoZSBzZXJpZXMgeW91IGNob3NlPyBFeHBsYWluIGJyaWVmbHkuCgpgYGB7cn0KZ2xvYmFsX2Vjb25vbXkgIyBzZWUgdGhlIGRhdGEuCgoKIyAxLkFuc3dlcjoKZ2xvYmFsX2Vjb25vbXkgJT4lCiBmaWx0ZXIoQ29kZSA9PSAiSVRBIiklPiUgbXV0YXRlKEdEUHBjID0gKEdEUC9Qb3B1bGF0aW9uKSkgJT4lIGF1dG9wbG90KEdEUHBjKQpgYGAKCiMjIyAyLgkKRm9yIGVhY2ggb2YgdGhlIGZvbGxvd2luZyBzZXJpZXMsIG1ha2UgYSBncmFwaCBvZiB0aGUgZGF0YS4gSWYgdHJhbnNmb3JtaW5nIHNlZW1zIGFwcHJvcHJpYXRlLCBkbyBzbyBhbmQgZGVzY3JpYmUgdGhlIGVmZmVjdC4gQ29tbWVudCBiZWxvdyBpbiBhbnN3ZXI6CgojIyMgMmEuIFVzZSB0aGUgc2VyaWVzIHlvdSBjaG9zZSBpbiAjMS4KYGBge3J9CgojIDJhLkFuc3dlcjoKSXRhbHkgPSBnbG9iYWxfZWNvbm9teSAlPiUgZmlsdGVyKENvdW50cnkgPT0gIkl0YWx5IikgJT4lIG11dGF0ZShHRFBwYyA9IChHRFAvUG9wdWxhdGlvbikpCgpJdGFseSAlPiUgZmVhdHVyZXMoR0RQcGMsIGZlYXR1cmVzID0gZ3VlcnJlcm8pICMgdGhlIGxhbWRhIGlzIDAsIHNvIHVzZSAwIGluIGJveC1jb3ggdHJhbnNmb3JtYXRpb24KCkl0YWx5ICU+JSBhdXRvcGxvdChib3hfY294KEdEUHBjLCAwKSkKCmBgYAoKIyMjIDJiLgkKVW5pdGVkIFN0YXRlcyBHRFAgZnJvbSBnbG9iYWxfZWNvbm9teS4KYGBge3J9CgoKIyAyYi5BbnN3ZXI6CnVzX2Vjb25vbXkgPC0gZ2xvYmFsX2Vjb25vbXkgJT4lCiBmaWx0ZXIoQ291bnRyeSA9PSAiVW5pdGVkIFN0YXRlcyIpCnVzX2Vjb25vbXkgJT4lCiBhdXRvcGxvdChib3hfY294KEdEUCwgMCkpCgp1c19lY29ub215ICU+JQogYXV0b3Bsb3QoYm94X2NveChHRFAsIDAuMykpCgoKdXNfZWNvbm9teSAlPiUKIGZlYXR1cmVzKEdEUCwgZmVhdHVyZXMgPSBndWVycmVybykKICAgICAgICAgIAoKdXNfZWNvbm9teSAlPiUKIGF1dG9wbG90KGJveF9jb3goR0RQLCAwLjI4MTk3MTQpKQoKCgpgYGAKCiMjIyAyYy4JClNsYXVnaHRlciBvZiBWaWN0b3JpYW4g4oCcQnVsbHMsIGJ1bGxvY2tzIGFuZCBzdGVlcnPigJ0gaW4gYXVzX2xpdmVzdG9jawpgYGB7cn0KCiMgMmMuQW5zd2VyOgoKdmljX2J1bGxzIDwtIGF1c19saXZlc3RvY2sgJT4lIGZpbHRlcihTdGF0ZSA9PSAiVmljdG9yaWEiLCBBbmltYWwgPT0gIkJ1bGxzLCBidWxsb2NrcyBhbmQgc3RlZXJzIikKdmljX2J1bGxzICU+JQogYXV0b3Bsb3QoQ291bnQpCgoKdmljX2J1bGxzICU+JQogZmVhdHVyZXMoQ291bnQsIGZlYXR1cmVzID0gZ3VlcnJlcm8pCgpgYGAKCiMjIyAyZC4KVmljdG9yaWFuIEVsZWN0cmljaXR5IERlbWFuZCBmcm9tIHZpY19lbGVjLgpgYGB7cn0KCgojIDJkLkFuc3dlcjoKdmljX2VsZWMgJT4lCiBhdXRvcGxvdChib3hfY294KERlbWFuZCwgMCkpCgoKYGBgCgojIyMgMmUuCQpHYXMgcHJvZHVjdGlvbiBmcm9tIGF1c19wcm9kdWN0aW9uLgpgYGB7cn0KCgojIDJlLkFuc3dlcjoKYXVzX3Byb2R1Y3Rpb24gJT4lCiBhdXRvcGxvdChHYXMpCgoKYXVzX3Byb2R1Y3Rpb24gJT4lCiBhdXRvcGxvdChib3hfY294KEdhcywgMCkpCgphdXNfcHJvZHVjdGlvbiAlPiUKIGZlYXR1cmVzKEdhcywgZmVhdHVyZXMgPSBndWVycmVybykKCgphdXNfcHJvZHVjdGlvbiAlPiUKIGF1dG9wbG90KGJveF9jb3goR2FzLCAwLjEwOTUpKQoKCgpgYGAKCiMjIyAzLglVc2UgdGhlIGNhbmFkaWFuX2dhcyBkYXRhIChtb250aGx5IENhbmFkaWFuIGdhcyBwcm9kdWN0aW9uIGluIGJpbGxpb25zIG9mIGN1YmljIG1ldHJlcywgSmFudWFyeSAxOTYwIOKAkyBGZWJydWFyeSAyMDA1KS4KIyMjIyAyYS4JUGxvdCB0aGUgZGF0YSB1c2luZyBhdXRvcGxvdCgpLCBnZ19zdWJzZXJpZXMoKSAsIGdnX3NlYXNvbigpIHRvIGxvb2sgYXQgdGhlIGVmZmVjdCBvZiB0aGUgY2hhbmdpbmcgc2Vhc29uYWxpdHkgb3ZlciB0aW1lLiBEZXNjcmliZSB0aGUgZ3JhcGhzIGluIHlvdXIgb3duIHdvcmRzLiBXaGF0IGRvIHlvdSBzZWU/IFdoYXQgdHlwZSBwZiBwYXR0ZXJuIGRvIHlvdSBvYnNlcnZlPwoKYGBge3J9CgoKIyAzYS5BbnN3ZXI6CmNhbmFkaWFuX2dhcyAlPiUgYXV0b3Bsb3QoVm9sdW1lKQoKY2FuYWRpYW5fZ2FzICU+JSBnZ19zdWJzZXJpZXMoVm9sdW1lKSAKCmNhbmFkaWFuX2dhcyAlPiUgZ2dfc2Vhc29uKFZvbHVtZSkgCgpgYGAKCiMjIyAzYi4KRG8gYW4gU1RMIGRlY29tcG9zaXRpb24gb2YgdGhlIGRhdGEuIFlvdSB3aWxsIG5lZWQgdG8gY2hvb3NlIGEgc2Vhc29uYWwgd2luZG93IHRvIGFsbG93IGZvciB0aGUgY2hhbmdpbmcgc2hhcGUgb2YgdGhlIHNlYXNvbmFsIGNvbXBvbmVudC4KCmBgYHtyfQoKIyAzYi5BbnN3ZXI6CiMgU1RMIG1vZGVsOgpmaXQgPC0gY2FuYWRpYW5fZ2FzICU+JQogbW9kZWwoU1RMKFZvbHVtZSkpICU+JQogY29tcG9uZW50cygpCgpmaXQKCm5hbWVzKGZpdCkKCmZpdCAlPiUgYXV0b3Bsb3QoKQpgYGAKCiMjIyAzYy4KSG93IGRvZXMgdGhlIHNlYXNvbmFsIHNoYXBlIGNoYW5nZSBvdmVyIHRpbWU/IFtIaW50OiBUcnkgcGxvdHRpbmcgdGhlIHNlYXNvbmFsIGNvbXBvbmVudCB1c2luZyBnZ19zZWFzb24oKS5dCmBgYHtyfQoKCiMgM2MuQW5zd2VyOgpmaXQgJT4lIGdnX3NlYXNvbihzZWFzb25feWVhcikKCgpgYGAKCiMjIyAzZC4JCnByb2R1Y2UgYSBwbGF1c2libGUgc2Vhc29uYWxseSBhZGp1c3RlZCBzZXJpZXM/IFdoYXQgYXJlIHRoZXNlIG51bWJlcnMsIHBsb3QgdGhlIHNlcmllcy4KYGBge3J9CgojIDNkLkFuc3dlcjoKU2Vhc29uYWxseUFkaiA8LSBmaXQkc2Vhc29uX2FkanVzdCAjIHNlYXNvbmFsbHkgYWRqdXN0ZWQgc2VyaWVzLgojICBvcmlnaW5hbCBzZXJpZXM6CmNhbmFkaWFuX2dhcyAlPiUKIGF1dG9wbG90KFZvbHVtZSkgKwogYXV0b2xheWVyKGZpdCwgc2Vhc29uX2FkanVzdCwgY29sID0gImJsdWUiKQpgYGAKCiMjIyA0LgpGb3IgcmV0YWlsIHRpbWUgc2VyaWVzLCB1c2UgdGhlIGJlbG93IGNvZGU6CgpgYGB7cn0KIyBydW4gdGhlIGNvZGUKc2V0LnNlZWQoMTIzNDU2NzgpCgpteXNlcmllcyA8LSBhdXNfcmV0YWlsICU+JQogIGZpbHRlcihgU2VyaWVzIElEYCA9PSBzYW1wbGUoYXVzX3JldGFpbCRgU2VyaWVzIElEYCwxKSkKCmhlYWQobXlzZXJpZXMsMikKCgoKYGBgCgojIyMjIDRhLiAKQ3JlYXRlIGEgdHJhaW5pbmcgZGF0YXNldCBjb25zaXN0aW5nIG9mIG9ic2VydmF0aW9ucyBiZWZvcmUgMjAxMSAKCmBgYHtyfQpteXNlcmllc190cmFpbiA8LSBteXNlcmllcyAlPiUKICBmaWx0ZXIoeWVhcihNb250aCkgPCAyMDExKQoKCmBgYAoKIyMjIyA0Yi4JCkNoZWNrIHRoYXQgeW91ciBkYXRhIGhhdmUgYmVlbiBzcGxpdCBhcHByb3ByaWF0ZWx5IGJ5IHByb2R1Y2luZyB0aGUgZm9sbG93aW5nIHBsb3QuCgpgYGB7cn0KYXV0b3Bsb3QobXlzZXJpZXMsIFR1cm5vdmVyKSArCiAgYXV0b2xheWVyKG15c2VyaWVzX3RyYWluLCBUdXJub3ZlciwgY29sb3VyID0gInJlZCIpCmBgYAoKIyMjIyA0Yy4JCkZpdCBhIHNlYXNvbmFsIG5hw692ZSBtb2RlbCB1c2luZyBTTkFJVkUoKSBhcHBsaWVkIHRvIHlvdXIgdHJhaW5pbmcgZGF0YSAobXlzZXJpZXNfdHJhaW4pLgpgYGB7cn0KICNBbnN3ZXI6CiAgICBmaXQgPC0gbXlzZXJpZXNfdHJhaW4gJT4lCiAgICAgIG1vZGVsKFNOQUlWRShUdXJub3ZlcikpCmBgYAoKCiMjIyMgNGQuCkNoZWNrIHRoZSByZXNpZHVhbHMuCmBgYHtyfQoKIyA0ZCBBbnN3ZXI6CmZpdCAlPiUgZ2dfdHNyZXNpZHVhbHMoKQojIERvIHRoZSByZXNpZHVhbHMgYXBwZWFyIHRvIGJlIHVuY29ycmVsYXRlZCBhbmQgbm9ybWFsbHkgZGlzdHJpYnV0ZWQ/CiMgQW5zdzogeWVzLCBub3JtYWxseSBkaXN0cmlidXRlZC4KYGBgCgojIyMjIDRlLgpQcm9kdWNlIGZvcmVjYXN0cyBmb3IgdGhlIHRlc3QgZGF0YSB3aXRoIGdpdmVuIGNvZGUgYmVsb3c6CgpgYGB7cn0KIyA0ZSBBbnN3ZXI6CmZjIDwtIGZpdCAlPiUgIApmb3JlY2FzdChuZXdfZGF0YSA9IGFudGlfam9pbihteXNlcmllcywgbXlzZXJpZXNfdHJhaW4pKQpmYyAlPiUgYXV0b3Bsb3QobXlzZXJpZXMpCgpgYGAKCkpvaW5pbmcgYnkgPSBjKCJTdGF0ZSIsICJJbmR1c3RyeSIsICJTZXJpZXMgSUQiLCAiTW9udGgiLCAiVHVybm92ZXIiKQoKIyMjIyA0Zi4JCkNvbXBhcmUgdGhlIGFjY3VyYWN5IG9mIHlvdXIgZm9yZWNhc3RzIGFnYWluc3QgdGhlIGFjdHVhbCB2YWx1ZXMgd2l0aCBnaXZlbiBjb2RlIGJlbG93OgpgYGB7cn0KZml0ICU+JSBhY2N1cmFjeSgpCmZjICU+JSBhY2N1cmFjeShteXNlcmllcykKIyA0ZiBBbnN3OlJNU0UgaXMgbG93ZXIgaW4gZmlyc3Qgc2VyaWVzLCBhcyAxLjIxLCBhbmQgUk1TRSBpcyAxLjU1IGluIG15c2VyaWVzLgoKYGBgCgojIyMjIDRnLgpIb3cgc2Vuc2l0aXZlIGFyZSB0aGUgYWNjdXJhY3kgbWVhc3VyZXMgdG8gdGhlIGFtb3VudCBvZiB0cmFpbmluZyBkYXRhIHVzZWQ/CmBgYHtyfQoKIyA0ZyBBbnN3ZXI6CiNUaGUgUk1TRSB2YWx1ZXMgYXJlIDEuMjEgYW5kIDEuNTUsIGluZGljYXRpbmcgc29tZSBzZW5zaXRpdml0eS4gVGhlIG1vZGVsIHBlcmZvcm1zIG11Y2ggYmV0dGVyIG9uIHRoZSB0cmFpbmluZyBkYXRhIGNvbXBhcmVkIHRvIHRoZSBvdXQtb2Ytc2FtcGxlIGRhdGEuIFRoaXMgZGlmZmVyZW5jZSBpcyBjb21tb24gYW5kLCBpbiB0aGlzIGNhc2UsIGlzIG5vdGljZWFibGUgYmVjYXVzZSB0aGUgbW9kZWwgaGFzbuKAmXQgY2FwdHVyZWQgdGhlIHRyZW5kIGluIHRoZSBkYXRhLiBUaGlzIGlzIGNsZWFyIGZyb20gdGhlIG1lYW4gZXJyb3IgYmVpbmcgYWJvdmUgemVybywgc2hvd2luZyB0aGF0IHRoZSBwcmVkaWN0aW9ucyBhcmUgZmFsbGluZyBzaG9ydCBvZiB0aGUgYWN0dWFsIHVwd2FyZCB0cmVuZCBpbiB0aGUgZGF0YS4KYGBgCgojIyMgNS4JCiMjIyMgNWEuCQpDcmVhdGUgYSB0cmFpbmluZyBzZXQgZm9yIEF1c3RyYWxpYW4gdGFrZWF3YXkgZm9vZCB0dXJub3ZlciAoYXVzX3JldGFpbCkgYnkgd2l0aGhvbGRpbmcgdGhlIGxhc3QgZm91ciB5ZWFycyBhcyBhIHRlc3Qgc2V0LiAKYGBge3J9CgoKIyA1YS5BbnN3ZXI6CnRha2Vhd2F5IDwtIGF1c19yZXRhaWwgJT4lCiBmaWx0ZXIoSW5kdXN0cnkgPT0gIlRha2Vhd2F5IGZvb2Qgc2VydmljZXMiKSAlPiUKIHN1bW1hcmlzZShUdXJub3ZlciA9IHN1bShUdXJub3ZlcikpCgp0cmFpbiA8LSB0YWtlYXdheSAlPiUKIGZpbHRlcih5ZWFyKE1vbnRoKSA8PSAyMDE0KQoKdGFpbCh0cmFpbikKYGBgCgojIyMjIDViLgkKRml0IGFsbCB0aGUgYXBwcm9wcmlhdGUgYmVuY2htYXJrIG1ldGhvZHMgdG8gdGhlICAgdHJhaW5pbmcgc2V0IGFuZCBmb3JlY2FzdCB0aGUgcGVyaW9kcyBjb3ZlcmVkIGJ5IHRoZSB0ZXN0IHNldC4KYGBge3J9CgoKIyA1Yi5BbnN3ZXI6CgpmaXQgPC0gdHJhaW4gJT4lCiBtb2RlbCgKIG5haXZlID0gTkFJVkUoVHVybm92ZXIpLAogZHJpZnQgPSBSVyhUdXJub3ZlciB+IGRyaWZ0KCkpLAogbWVhbiA9IE1FQU4oVHVybm92ZXIpLAogc25haXZlID0gU05BSVZFKFR1cm5vdmVyKQogKQoKCmZjIDwtIGZpdCAlPiUgZm9yZWNhc3QoaCA9ICI0IHllYXJzIikKCgpgYGAKCiMjIyMgNWMuCQpDb21wdXRlIHRoZSBhY2N1cmFjeSBvZiB5b3VyIGZvcmVjYXN0cy4gV2hpY2ggbWV0aG9kIGRvZXMgYmVzdD8KYGBge3J9CgoKIyA1Yy5BbnN3ZXI6CgoKZmMgJT4lCiBhY2N1cmFjeSh0YWtlYXdheSkgJT4lCiBhcnJhbmdlKE1BU0UpCgojVGhlIG5haXZlIG1ldGhvZCBpcyBiZXN0IGhlcmUgYWNjb3JkaW5nIHRvIE1BU0UgdmFsdWUuIEl0J3MgbWluaW11bSBhdCBuYWl2ZS4KYGBgCgojIyMjIDVkLgpEbyB0aGUgcmVzaWR1YWxzIGZyb20gdGhlIGJlc3QgbWV0aG9kIHJlc2VtYmxlIHdoaXRlIG5vaXNlPwpgYGB7cn0KCiMgNWQuQW5zd2VyOgpmaXQgJT4lCiBzZWxlY3QobmFpdmUpICU+JQogZ2dfdHNyZXNpZHVhbHMoKQoKIyBUaGlzIGlzIGZhciBmcm9tIHdoaXRlIG5vaXNlLiBUaGVyZSBpcyBzdHJvbmcgc2Vhc29uYWxpdHkgYW5kIGluY3JlYXNpbmcgdmFyaWFuY2UgdGhhdCBoYXMgbm90IGJlZW4gYWNjb3VudGVkIGZvciBieSB0aGUgbmFpdmUgbW9kZWwuCiMgbG9vayBhdCB0aGUgYWNmIHZhbHVlcywgaXQgaGFzIHBlYWsgYXQgZGlmZmVyZW50IGxhZ3MsIHNob3dpbmcgc2Vhc29uYWxpdHkuCgpgYGAKCiMjIyA2LgkKVXNpbmcgdGhlIGNvZGUgYmVsb3csIGdldCBhIHNlcmllcyAoaXQgZ2V0cyBhIHNlcmllcyByYW5kb21seSBieSB1c2luZyBzYW1wbGUoKSBmdW5jdGlvbik6CmBgYHtyfQpzZXQuc2VlZCgxMjM0NTY3OCkKbXlzZXJpZXMgPC0gYXVzX3JldGFpbCAlPiUKICBmaWx0ZXIoYFNlcmllcyBJRGAgPT0gc2FtcGxlKGF1c19yZXRhaWwkYFNlcmllcyBJRGAsMSkpCmBgYApzZWUgaGVhZCBvZiB5b3VyIHNlcmllcyB0byBjaGVjayBpdCBpcyBhIHRzaWJibGUgZGF0YSwgYW5kIHJlbW92ZSBOQeKAmXMgaWYgdGhlcmUgaXMgYW55IHdpdGggdGhlc2UgY29tbWFuZHM6CgpgYGB7cn0KaGVhZChteXNlcmllcykKbXlzZXJpZXMgPSAgbXlzZXJpZXMgJT4lIGZpbHRlcighaXMubmEoYFNlcmllcyBJRGApKQpgYGAKCiMjIyMgNmEuCldoYXQgaXMgdGhlIG5hbWUgb2YgdGhlIHNlcmllcyB5b3UgcmFuZG9tbHkgY2hvb3NlPyBXcml0ZSBpdC4KYGBge3J9CgojIDZhLkFuc3dlcjoKIyBJdCBpcyBBMzM0OTc2N1cgLgoKYGBgCgojIyMjIDZiLiAKUnVuIGEgbGluZWFyIHJlZ3Jlc3Npb24gb2YgVHVybm92ZXIgb24gdHJlbmQuKEhpbnQ6IHVzZSBUU0xNKCkgYW5kIHRyZW5kKCkgZnVuY3Rpb25zKQpgYGB7cn0KIyA2Yi5BbnN3ZXI6CgpmaXQgPSBteXNlcmllcyAlPiUgbW9kZWwoVFNMTShUdXJub3Zlcn4gdHJlbmQoKSkpCgpgYGAKCiMjIyMgNmMuIApTZWUgdGhlIHJlZ3Jlc3Npb24gcmVzdWx0IGJ5IHJlcG9ydCgpIGNvbW1hbmQuCmBgYHtyfQojIDZjLkFuc3dlcjoKcmVwb3J0KGZpdCkKCmBgYAoKCiMjIyMgNmQuCQpCeSB1c2luZyB0aGlzIG1vZGVsLCBmb3JlY2FzdCBpdCBmb3IgdGhlIG5leHQgMyB5ZWFycy4gV2hhdCBhcmUgdGhlIHZhbHVlcyBvZiB0aGUgbmV4dCAzIHllYXJzLCBtb250aGx5IHZhbHVlcz8KYGBge3J9CgojIDZkLkFuc3dlcjoKCgpmaXQgJT4lIGZvcmVjYXN0KGg9MzYpCgpgYGAKCiMjIyMgNmQuCQpQbG90IHRoZSBmb3JlY2FzdCB2YWx1ZXMgYWxvbmcgd2l0aCB0aGUgb3JpZ2luYWwgZGF0YS4KYGBge3J9CgojIDZkLkFuc3dlcjoKZml0ICU+JSBmb3JlY2FzdChoPTM2ICklPiUgYXV0b3Bsb3QobXlzZXJpZXMpCgogCmZpdCAlPiUgZm9yZWNhc3QoaD0zNiApJT4lIGF1dG9wbG90KCkKYGBgCgojIyMjIDZlLgkKR2V0IHRoZSByZXNpZHVhbHMgZnJvbSB0aGUgbW9kZWwuIEFuZCBjaGVjayB0aGUgcmVzaWR1YWxzIHRvIGNoZWNrIHdoZXRoZXIgb3Igbm90IGl0IHNhdGlzZmllcyB0aGUgcmVxdWlyZW1lbnRzIGZvciB3aGl0ZSBub2lzZSBlcnJvciB0ZXJtcy4oaGludDogYXVnbWVudCgpIGFuZCBnZ190c3Jlc2lkdWFscygpIGZ1bmN0aW9ucykKCmBgYHtyfQoKIyA2ZS5BbnN3ZXI6CgoKIGZpdCAlPiUgZ2dfdHNyZXNpZHVhbHMoKQoKCmBgYAoKCiMjIyA3LiAKSGFsZi1ob3VybHkgZWxlY3RyaWNpdHkgZGVtYW5kIGZvciBWaWN0b3JpYSwgQXVzdHJhbGlhIGlzIGNvbnRhaW5lZCBpbiB2aWNfZWxlYy4gRXh0cmFjdCB0aGUgSmFudWFyeSAyMDE0IGVsZWN0cmljaXR5IGRlbWFuZCwgYW5kIGFnZ3JlZ2F0ZSB0aGlzIGRhdGEgdG8gZGFpbHkgd2l0aCAgZGFpbHkgdG90YWwgZGVtYW5kcyBhbmQgbWF4aW11bSB0ZW1wZXJhdHVyZXMuIFJ1biB0aGUgY29kZSBiZWxvdzoKCmBgYHtyfQpqYW5fdmljX2VsZWMgPC0gdmljX2VsZWMgJT4lCiAgZmlsdGVyKHllYXJtb250aChUaW1lKSA9PSB5ZWFybW9udGgoIjIwMTQgSmFuIikpICU+JQogIGluZGV4X2J5KERhdGUgPSBhc19kYXRlKFRpbWUpKSAlPiUKICBzdW1tYXJpc2UoRGVtYW5kID0gc3VtKERlbWFuZCksIFRlbXBlcmF0dXJlID0gbWF4KFRlbXBlcmF0dXJlKSkKCmBgYAoKIyMjIyA3YS4gClBsb3QgdGhlIGRhdGEgYW5kIGZpbmQgdGhlIHJlZ3Jlc3Npb24gbW9kZWwgZm9yIERlbWFuZCB3aXRoIHRlbXBlcmF0dXJlIGFzIGEgcHJlZGljdG9yIHZhcmlhYmxlLiBXaHkgaXMgdGhlcmUgYSBwb3NpdGl2ZSByZWxhdGlvbnNoaXA/CmBgYHtyfQoKIyA3YS5BbnN3ZXI6Cmphbl92aWNfZWxlYyAlPiUKIGdncGxvdChhZXMoeCA9IFRlbXBlcmF0dXJlLCB5ID0gRGVtYW5kKSkgKwogZ2VvbV9wb2ludCgpCgpmaXQgPC0gamFuX3ZpY19lbGVjICU+JQogbW9kZWwoVFNMTShEZW1hbmQgfiBUZW1wZXJhdHVyZSkpCgogZml0ICU+JSByZXBvcnQoKQpgYGAKCiMjIyMgN2IuIApQcm9kdWNlIGEgcmVzaWR1YWwgcGxvdC4gSXMgdGhlIG1vZGVsIGFkZXF1YXRlPyBBcmUgdGhlcmUgYW55IG91dGxpZXJzIG9yIGluZmx1ZW50aWFsIG9ic2VydmF0aW9ucz8KCmBgYHtyfQoKIyA3Yi5BbnN3ZXI6CmZpdCAlPiUgZ2dfdHNyZXNpZHVhbHMoKQoKI1RoZSByZXNpZHVhbHMgZnJvbSB0aGlzIHNlY3Rpb24gb2YgdGhlIGRhdGEgc3VnZ2VzdCB0aGF0IHRoZSBtb2RlbCBpcyBsYWNraW5nIGEgdHJlbmQgKGFsdGhvdWdoIGxvb2tpbmcgYXQgYSBsYXJnZXIgd2luZG93IG9mIHRoZSBkYXRhLCB0aGlzIGlzIGNsZWFybHkgbm90IGEgcmVhbCBwYXR0ZXJuKS4gU29tZSBsYXJnZSB2YXJpYWJpbGl0eSBzdWdnZXN0cyB0aGF0IHRoZXJlIGFyZSBzb21lIG91dGxpZXJzIGluIHRoaXMgZGF0YS4KCmBgYAoKIyMjIyA3Yy4KVXNlIHRoZSBtb2RlbCB0byBmb3JlY2FzdCB0aGUgZWxlY3RyaWNpdHkgZGVtYW5kIHRoYXQgeW91IHdvdWxkIGV4cGVjdCBmb3IgdGhlIG5leHQgZGF5IGlmIHRoZSBtYXhpbXVtIHRlbXBlcmF0dXJlIHdhcyAxNeKImEMgYW5kIGNvbXBhcmUgaXQgd2l0aCB0aGUgZm9yZWNhc3QgaWYgdGhlIHdpdGggbWF4aW11bSB0ZW1wZXJhdHVyZSB3YXMgMzXiiJhDLiBEbyB5b3UgYmVsaWV2ZSB0aGVzZSBmb3JlY2FzdHM/CgpgYGB7cn0KCgoKIyA3Yy5BbnN3ZXI6Ck5leHRfRGF5IDwtIHNjZW5hcmlvcygKICBDb2xkZGF5ID0gbmV3X2RhdGEoamFuX3ZpY19lbGVjLCAxKSAlPiUgbXV0YXRlKFRlbXBlcmF0dXJlID0gMTUpLAogIEhvdGRheSA9IG5ld19kYXRhKGphbl92aWNfZWxlYywgMSkgJT4lIG11dGF0ZShUZW1wZXJhdHVyZSA9IDM1KQopCgpmYyA8LSBmaXQgJT4lCiAgZm9yZWNhc3QobmV3X2RhdGEgPSBOZXh0X0RheSkgCgoKYXV0b3Bsb3QoamFuX3ZpY19lbGVjLCBEZW1hbmQpICsKICBhdXRvbGF5ZXIoZmMsIHNlcmllcyA9ICJGb3JlY2FzdCIsIFBJID0gVFJVRSwgYWxwaGEgPSAwLjUpICsgCiAgbGFicyh0aXRsZSA9ICJEZW1hbmQgRm9yZWNhc3QgZm9yIGVsZWN0cmljaXR5IiwKICAgICAgIHggPSAiRGF0ZSIsCiAgICAgICB5ID0gIkRlbWFuZCIpCiAgCgpqYW5fdmljX2VsZWMgJT4lCiBtb2RlbChUU0xNKERlbWFuZCB+IFRlbXBlcmF0dXJlKSkgJT4lCiBmb3JlY2FzdCgKIG5ld19kYXRhKGphbl92aWNfZWxlYywgMSkgJT4lCiBtdXRhdGUoVGVtcGVyYXR1cmUgPSAxNSkKICkgJT4lCiBhdXRvcGxvdChqYW5fdmljX2VsZWMpCgojVGhlIGZvcmVjYXN0cyBzZWVtIHJlYXNvbmFibGUuIEhvd2V2ZXIgd2Ugc2hvdWxkIGJlIGF3YXJlIHRoYXQgdGhlcmUgaXMgbm90IG11Y2ggZGF0YSB0byBzdXBwb3J0IHRoZSBmb3JlY2FzdHMgYXQgdGhlc2UgdGVtcGVyYXR1cmUgZXh0cmVtZXMsIGVzcGVjaWFsbHkgaW4gdGhhdCBubyBkYWlseSBtYXhpbXVtIGJlbG93IDIw4oiYQwojaXMgb2JzZXJ2ZWQgZHVyaW5nIEphbnVhcnkgKGEgc3VtbWVyIG1vbnRoIGluIFZpY3RvcmlhKS4KYGBgCgojIyMjIDdkLgpEbyB5b3UgYmVsaWV2ZSB0aGVzZSBmb3JlY2FzdHM/IFRoZSBmb2xsb3dpbmcgUiBjb2RlIHdpbGwgZ2V0IHlvdSBzdGFydGVkOgpgYGB7cn0KCiMgN2QuQW5zd2VyOgogamFuX3ZpY19lbGVjICU+JQogbW9kZWwoVFNMTShEZW1hbmQgfiBUZW1wZXJhdHVyZSkpICU+JQogZm9yZWNhc3QobmV3X2RhdGEoamFuX3ZpY19lbGVjLCAxKSAlPiUKIG11dGF0ZShUZW1wZXJhdHVyZSA9IDE1KQogKSAlPiUKCiBhdXRvcGxvdChqYW5fdmljX2VsZWMpCmBgYAogCiMjIyMgN2UuIApHaXZlIHByZWRpY3Rpb24gaW50ZXJ2YWxzIGZvciB5b3VyIGZvcmVjYXN0cy4KCmBgYHtyfQoKCiMgN2UuQW5zd2VyOgpmYyAlPiUKIGhpbG8oOTUpICU+JQogc2VsZWN0KC0ubW9kZWwpCgpgYGAKCgojIyMgOC4KUmVhZCB0aGUgc2hhbXBvbyBkYXRhIGdpdmVuIGluIGV4Y2VsIChJbXBvcnQgRGF0YXNldCBhcyBFeGNlbCkKICAKYGBge3J9CiMgYS4JVmlldyB0aGUgc2hhbXBvbyBzYWxlcyBkYXRhLiBIb3cgbWFueSB2YXJpYWJsZXMgYXJlIHRoZXJlPyBGaW5kIGhvdyBtYW55IHJvd3MgYW5kIGNvbHVtbiBpbiB0aGUgZGF0YT8KbGlicmFyeShyZWFkeGwpCnNoYW1wb29fMiA8LSByZWFkX2V4Y2VsKCJzaGFtcG9vLTIueGxzeCIpCmBgYAoKYGBge3J9CiNiLglJcyB0aGUgZGF0YSBhbm51YWwsIG1vbnRobHksIHF1YXJ0ZXJseT8KICAgc3RyKHNoYW1wb29fMikgI2RhdGEgZnJhbWUKICAgCiAgICMgQW5zdzogTW9udGhseSBkYXRhCiNjLglDb252ZXJ0IHRoZSBkYXRhIGludG8gdGliYmxlICwgdGhlbiB0c2liYmxlIAogbXlkYXRhID0gc2hhbXBvb18yICU+JQogbXV0YXRlKE1PTlRITFkgPSB5ZWFybW9udGgoTW9udGgpKSAlPiUgYXNfdHNpYmJsZShpbmRleCA9IE1PTlRITFkpICU+JSBzZWxlY3QoLU1vbnRoKQpzdHIobXlkYXRhKQoKbXlkYXRhCgojZC4JUGxvdCB0aGUgc2hhbXBvbyBzYWxlcy4gV2hhdCBkbyB5b3Ugc2VlIGZyb20gdGhlIGRhdGEgcGF0dGVybj8gV2hhdCBkb2VzIHgtYXhpcyByZXByZXNlbnQ/IApwbG90KHNoYW1wb29fMiRzYWxlcywgdHlwZSA9ImwiKQoKbXlkYXRhICU+JQogYXV0b3Bsb3Qoc2FsZXMpICsKIGxhYnModGl0bGUgPSAiTW9udGhseSBTaGFtcG9vIFNhbGVzIiwgeT0gImluICQiKQojIENvbW1lbnQgaGVyZS4gVXNlIHBsb3QoKSBhbmQgYXV0b3Bsb3QoKS5QdXQgdGhlIG5hbWUgZm9yIHkgYXhpcywgYW5kIGEgdGl0bGUgZm9yIHRoZSBncmFwaC4KICAKI2UuCVdoYXQgaXMgdGhlIGF2ZXJhZ2UsIGFuZCBtZWRpYW4gb2Ygc2hhbXBvbyBzYWxlcy4gUHV0IGl0IG9uIGEgaGlzdG9ncmFtLgogIG1lYW5TYWxlcyA9IG1lYW4oc2hhbXBvb18yJHNhbGVzKQptZWFuU2FsZXMKCm1lZGlhbihzaGFtcG9vXzIkc2FsZXMpCgpoaXN0KHNoYW1wb29fMiRzYWxlcykKCm15ZGF0YSAlPiUKIGdncGxvdChhZXMoeD1zYWxlcykpICsKIGdlb21faGlzdG9ncmFtKGJpbj0xMCkKCiNmLglHZXQgc2Vhc29uYWwgcGxvdC4gV2hhdCBkbyB5b3Ugc2VlLyBpcyB0aGVyZSBhbnkgcGF0dGVybiwgaXMgdGhlcmUgYW55IHNlYXNvbmFsaXR5LgogIApteWRhdGEgJT4lIGdnX3NlYXNvbihzYWxlcykgIyB5ZXMsIHRoZXJlIGlzIGEgdHJlbmQuIDE5OTcgaXMgaGlnaGVyIHRoYW4gMTk5NiBhbmQgdGhhbiAxOTk1LgoKbXlkYXRhICU+JSBnZ19zdWJzZXJpZXMoc2FsZXMpICMgaXQgbG9va3MgbGlrZSB0aGVyZSBpcyBtb250aGx5IGVmZmVjdC4gaXQgaXMgaGlnaGVyIGluIGp1bC1kZWNlbWJlciBpbnRlcnZhbC4KCgojZy4JR2V0IGEgbGluZWFyIHJlZ3Jlc3Npb24gbGluZSB3aXRoIHRyZW5kIGFuZCBkdW1teSBmb3IgZWFjaCBtb250aCAoSGludDogdXNlIHRyZW5kIGFuZCBzZWFzb24gaW4gcmVncmVzc2lvbiBlcXVhdGlvbikuCiAgCmZpdCA9IG15ZGF0YSAlPiUgbW9kZWwoVFNMTShzYWxlcyB+IHRyZW5kKCkgKyBzZWFzb24oKSkpCgojaC4JQ29tbWVudCBvbiBlYWNoIGVzdGltYXRlZCBjb2VmZmljaWVudCBvZiB0aGUgbW9kZWwuQXJlIHRoZXkgc3RhdGlzdGljYWxseSBzaWduaWZpY2FudCBhdCA1ICUgc2lnbmlmaWNhbmNlIGxldmVsPwoKcmVwb3J0KGZpdCkKCiMgQW5zdzogbm8gaXQgaXMgbm90IHNpZ25pZmljYW50LiBubyBtb250aGx5IGVmZmVjdCwgYnV0IHRyZW5kIGlzIHN0YXRpc3RpY2FsbHkgc2lnbmlmaWNhbnQgYXQgNSAlLgogIAojaS4JV2hpY2ggbW9udGggaGFzIHRoZSBoaWdoZXN0IHNhbGVzPwogICAjIGRlY2VtYmVyIGFuZCBub3ZlbWJlci4KCiNqLglGb3JlY2FzdCBpdCBmb3IgdGhlIG5leHQgeWVhci4gV2hhdCBhcmUgdGhlIHZhbHVlcwogIGZvcmVjYXN0cyA9IGZpdCAlPiUgZm9yZWNhc3QoaD0xMikKZm9yZWNhc3RzCgojay4JUGxvdCB0aGUgZm9yZWNhc3Qgd2l0aCBvcmlnaW5hbCBkYXRhLgogIGZpdCAlPiUgZm9yZWNhc3QoaD0xMikgJT4lIGF1dG9wbG90KG15ZGF0YSkKICBmb3JlY2FzdHMgJT4lIGF1dG9wbG90KG15ZGF0YSkKI2wuCUNoZWNrIGlmIHRoZSByZXNpZHVhbHMgb2YgdGhlIG1vZGVsIGlzIHdoaXRlIG5vaXNlLgogIGZpdCAlPiUgZ2dfdHNyZXNpZHVhbHMKICAjIGl0IGlzIGF1dG9jb3JyZWxhdGlvbiBhdCAxIGxhZy4KICMjIyBBbnN3OiBub3Qgd2hpdGUgbm9pc2UuCiAgCiNtIEJ5IHVzaW5nIHRoZSByZWdyZXNzaW9uIG1vZGVsLCBjaGVjayB0aGUgYWNjdXJhY3kgb2YgdGhlIGZvcmVjYXN0LiBXaGF0IGlzIE1TRSwgUk1TRSB2YWx1ZXM/CiAgYWNjdXJhY3koZml0KQoKYGBgCiAgICAK

EXAM I

Namburu Venkata Sai Phanindra and vanmb3@unh.newhaven.edu

2024-11-03

1.

1. Choose a random country by yourself. Then plot the GDP per capita for this country over time? How GDP per capita has changed over time for the series you chose? Explain briefly.

2.

2a. Use the series you chose in #1.

2b.

2c.

2d.

2e.

3. Use the canadian_gas data (monthly Canadian gas production in billions of cubic metres, January 1960 – February 2005).

2a. Plot the data using autoplot(), gg_subseries() , gg_season() to look at the effect of the changing seasonality over time. Describe the graphs in your own words. What do you see? What type pf pattern do you observe?

3b.

3c.

3d.

4.

4a.

4b.

4c.

4d.

4e.

4f.

4g.

5.

5a.

5b.

5c.

5d.

6.

6a.

6b.

6c.

6d.

6d.

6e.

7.

7a.

7b.

7c.

7d.

7e.

8.