#Libraries uploading
library(tseries)
library(plotly)
library(xts)
library(dplyr)
library(zoo)
library(tseries)
library(stats)
library(forecast)
library(astsa)
library(corrplot)
library(AER)
library(vars)
library(dynlm)
library(vars)
library(TSstudio)
library(tidyverse)
library(sarima)
library(dygraphs)
library(TSstudio)
library(dlookr)
library(kableExtra)
library(effects)
library(visdat)
library(foreign)
library(dplyr)        # data manipulation 
library(forcats)      # to work with categorical variables
library(ggplot2)      # data visualization 
library(readr)        # read specific csv files
library(janitor)      # data exploration and cleaning 
library(Hmisc)        # several useful functions for data analysis 
library(psych)        # functions for multivariate analysis 
library(naniar)       # summaries and visualization of missing values NAs
library(dlookr)       # summaries and visualization of missing values NAs
library(corrplot)     # correlation plots
library(jtools)       # presentation of regression analysis 
library(lmtest)       # diagnostic checks - linear regression analysis 
library(car)          # diagnostic checks - linear regression analysis
library(kableExtra)   # HTML table attributes
library(tidyverse)
library(caret)
library(glmnet)
library(Metrics)

CC <- read.csv("C:\\Users\\danyb\\OneDrive - Instituto Tecnologico y de Estudios Superiores de Monterrey\\Docs\\Documentos\\Business Intelligence\\Quinto Semestre\\Introduction to Econometrics\\Examen\\cocacola.csv")

A) Exploratory Data Analysis (EDA)

Briefly describe the dataset. For example, what is the structure of the dataset? How many observations include the dataset? Is there any presence of missing values in the dataset?

coca-cola dataset will be used for this analysis

The Coca-Cola Company: “Founded in 1886, The Coca-Cola Company is the world’s largest beverage company, refreshing consumers with more than 500 sparkling and still brands. The Coca-Cola Company’s corporate headquarters are in Atlanta with local operations in more than 200 countries around the world”. (Coca-Cola FEMSA / 2016 Annual Report, 2016)

Variables for this data set are the following:

tperiod: date

sales_unitboxes dependent variable: sales coca-cola unit boxes

consumer_sentiment: how consumers feel about the state of the economy

CPI: consumer price index 2018=100

inflation_rate: change in the consumer price index 2018=100

unemp_rate: percentage of the labor force that is unemployed

gdp_percapita: gross domestic population by population

itaee: Indicator of the State Economic Activity - ITAEE

itaee_growth: itaee’s growth rate

pop_density: population per km2

job_density: employed population per km2

pop_minwage: population per km2 earning 1-2 miniumum wages

exchange_rate: exchange rate U.S. - MXN

max_temperature: average max temperature

holiday_month: 1 if month includes a holiday week including: public holiday, easter holiday, and christmas; 0 otherwise

str(CC)

## 'data.frame':    48 obs. of  15 variables:
##  $ tperiod           : chr  "15-ene" "15-feb" "15-mar" "15-abr" ...
##  $ sales_unitboxes   : num  5516689 5387496 5886747 6389182 6448275 ...
##  $ consumer_sentiment: num  38.1 37.5 38.5 37.8 38 ...
##  $ CPI               : num  87.1 87.3 87.6 87.4 87 ...
##  $ inflation_rate    : num  -0.09 0.19 0.41 -0.26 -0.5 0.17 0.15 0.21 0.37 0.51 ...
##  $ unemp_rate        : num  0.0523 0.0531 0.0461 0.051 0.0552 0.0507 0.0542 0.0547 0.0538 0.0539 ...
##  $ gdp_percapita     : num  11660 11660 11660 11626 11626 ...
##  $ itaee             : num  104 104 104 108 108 ...
##  $ itaee_growth      : num  0.0497 0.0497 0.0497 0.0318 0.0318 0.0318 0.0565 0.0565 0.0565 0.0056 ...
##  $ pop_density       : num  98.5 98.5 98.5 98.8 98.8 ...
##  $ job_density       : num  18.3 18.5 18.6 18.7 18.7 ...
##  $ pop_minwage       : num  9.66 9.66 9.66 9.59 9.59 ...
##  $ exchange_rate     : num  14.7 14.9 15.2 15.2 15.3 ...
##  $ max_temperature   : int  28 31 29 32 34 32 29 29 29 29 ...
##  $ holiday_month     : int  0 0 0 1 0 0 0 0 1 0 ...

It is possible to see that the data set mostly has numeric variables, except for preiod, max_temperature and holiday_month. It will be necessary to transform some of them.

CC$tperiod <- as.Date(CC$tperiod, format = "yyyy-mm-dd") #CORRECT FORMAT FOR DATES
CC$max_temperature<-as.numeric(CC$max_temperature)# In order to make some plots, it needs to be numeric.

dim(CC)

## [1] 48 15

The dataset includes 48 observations, and 15 different variables.

sum(is.na(CC))

## [1] 48

There are no missing values for this dataset.

Include summary of descriptive statistics. What is the mean, min, and max values of the dependent variable?

summary(CC)

##     tperiod    sales_unitboxes   consumer_sentiment      CPI        
##  Min.   :NA    Min.   :5301755   Min.   :28.67      Min.   : 86.97  
##  1st Qu.:NA    1st Qu.:6171767   1st Qu.:35.64      1st Qu.: 89.18  
##  Median :NA    Median :6461357   Median :36.76      Median : 92.82  
##  Mean   :NaN   Mean   :6473691   Mean   :37.15      Mean   : 93.40  
##  3rd Qu.:NA    3rd Qu.:6819782   3rd Qu.:38.14      3rd Qu.: 98.40  
##  Max.   :NA    Max.   :7963063   Max.   :44.87      Max.   :103.02  
##  NA's   :48                                                         
##  inflation_rate      unemp_rate      gdp_percapita       itaee      
##  Min.   :-0.5000   Min.   :0.03470   Min.   :11559   Min.   :103.8  
##  1st Qu.: 0.1650   1st Qu.:0.04010   1st Qu.:11830   1st Qu.:111.5  
##  Median : 0.3850   Median :0.04370   Median :12014   Median :113.5  
##  Mean   : 0.3485   Mean   :0.04442   Mean   :11979   Mean   :113.9  
##  3rd Qu.: 0.5575   3rd Qu.:0.04895   3rd Qu.:12162   3rd Qu.:117.1  
##  Max.   : 1.7000   Max.   :0.05520   Max.   :12329   Max.   :122.5  
##                                                                     
##   itaee_growth      pop_density      job_density     pop_minwage    
##  Min.   :0.00560   Min.   : 98.54   Min.   :18.26   Min.   : 9.398  
##  1st Qu.:0.02237   1st Qu.: 99.61   1st Qu.:19.28   1st Qu.:10.794  
##  Median :0.02995   Median :100.67   Median :20.39   Median :11.139  
##  Mean   :0.03172   Mean   :100.65   Mean   :20.38   Mean   :11.116  
##  3rd Qu.:0.04300   3rd Qu.:101.69   3rd Qu.:21.60   3rd Qu.:11.413  
##  Max.   :0.05650   Max.   :102.69   Max.   :22.36   Max.   :13.026  
##                                                                     
##  exchange_rate   max_temperature holiday_month 
##  Min.   :14.69   Min.   :26.00   Min.   :0.00  
##  1st Qu.:17.38   1st Qu.:29.00   1st Qu.:0.00  
##  Median :18.62   Median :30.00   Median :0.00  
##  Mean   :18.18   Mean   :30.50   Mean   :0.25  
##  3rd Qu.:19.06   3rd Qu.:32.25   3rd Qu.:0.25  
##  Max.   :21.39   Max.   :37.00   Max.   :1.00  
##

Looking at this summary, it is possible to identify that there are not outliers for this data set. All the variables have a similar value for their mean and median. Values for dependent variable are:

min: 5301755
median: 6461357
mean: 6473691
max: 7963063

B) Data Visualization

Show at least 4-5 plots including pair-wised graphs, frequency plots, correlation matrix plots, scatter plots, box plots, and / or histogram plots, etc.

tsplot(CC$sales_unitboxes)

It is interesting to see how in this time series plot, sales in unit boxes seems to have an stational pattern, with rises and falls.

ggplot(CC, aes(x = inflation_rate, y = sales_unitboxes)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE) +
  labs(x = "Inflation Rate",
       y = "Sales in box units",
       title = "Relation between Sales and Inflation Rate")

## `geom_smooth()` using formula = 'y ~ x'

It is possible to identify two different things in this graph:

Inflation rate seems to have a negative relation with sales.
The majority of inflation rate seems to be on the left side of the graph, which could be a left-skewed distribution.

par(mfrow=c(3, 4))

hist(CC$sales_unitboxes) # log
hist(CC$consumer_sentiment)
hist(CC$CPI) #Not
hist(CC$inflation_rate) #log
hist(CC$unemp_rate)
hist(CC$itaee) #log
hist(CC$itaee_growth) #Not
hist(CC$pop_density)
hist(CC$job_density)
hist(CC$pop_minwage) #log
hist(CC$max_temperature)
hist(CC$exchange_rate)

This histogram’s matrix were done with the intention of detecting non normal distribution in the variables for the dataset. If a normal distribution is not observed in one or more variables, it could be an option to transform them into their log value. An example for this are the variables “inflation_rate”, “itaee”, “pop_minwage”, among others.

CC1 <- CC %>% dplyr::select(-holiday_month, -tperiod)
corrplot(cor(CC1), type = 'upper', order = 'hclust', addCoef.col = 'black', tl.cex = 0.9, tl.srt = 90, mar = c(0,0,0,0),number.cex=1)

This correlation plot shows the relationship between variables in the dataset. It is important to find which of these variables have significant correlation with dependent variable “sales_unitboxes”. The highest correlated variables with dependent variables are:

max_temperature with a 0.57 value.
inflation_rate with a -0.34 value (negative relation).
itaee with a 0.32 value.

It is relevant to understand that correlation is not the same as regression, this plot could give a few parameters to start estimating a model, but significative variables for an accurate model could not be the most correlated ones.

Select 1-2 plots and briefly describe the data patterns.

(I described the 4 graphs I made)

C) Linear Regression Model specification

Briefly describe the hypotheses statements. That is, what is the expected impact of the explanatory variable X on the dependent variable Y.

H1: It might be expected a positive relation between max temperature and dependent variable sales unit boxes.
H2: It might be expected a positive relation between itaee and sales unit boxes.
H3: It might be expected a negative relation between inflation rate and sales unit boxes.

Estimate 2 different multiple linear regression model specifications.

Model 1:

model1<-lm(sales_unitboxes ~ consumer_sentiment + CPI + inflation_rate + unemp_rate+ gdp_percapita + itaee + itaee_growth + pop_density + job_density + log(pop_minwage) + exchange_rate + max_temperature + holiday_month, data=CC)
summary(model1)

## 
## Call:
## lm(formula = sales_unitboxes ~ consumer_sentiment + CPI + inflation_rate + 
##     unemp_rate + gdp_percapita + itaee + itaee_growth + pop_density + 
##     job_density + log(pop_minwage) + exchange_rate + max_temperature + 
##     holiday_month, data = CC)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -504466 -220234   -6898  196922  758377 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        -98517471   49342629  -1.997   0.0539 .  
## consumer_sentiment     46725      28066   1.665   0.1051    
## CPI                  -139593     101913  -1.370   0.1798    
## inflation_rate         27714     282353   0.098   0.9224    
## unemp_rate          -9381467   19802288  -0.474   0.6387    
## gdp_percapita          -2627       1475  -1.781   0.0839 .  
## itaee                  12921      84192   0.153   0.8789    
## itaee_growth         4561673    5401479   0.845   0.4043    
## pop_density          1459283     762070   1.915   0.0640 .  
## job_density          -470162     485876  -0.968   0.3400    
## log(pop_minwage)     2032031    1597502   1.272   0.2120    
## exchange_rate         -60533     119054  -0.508   0.6144    
## max_temperature       178035      38946   4.571 6.13e-05 ***
## holiday_month         199639     143900   1.387   0.1744    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 366300 on 34 degrees of freedom
## Multiple R-squared:  0.7292, Adjusted R-squared:  0.6256 
## F-statistic: 7.042 on 13 and 34 DF,  p-value: 2.348e-06

This model shows a few significant variables, where max_temperature are highly significant, with a 99% of significance.

Model 2

model2<-lm(log(sales_unitboxes) ~ consumer_sentiment + inflation_rate + unemp_rate + log(itaee) + pop_density + job_density + log(pop_minwage) + exchange_rate + I(max_temperature^2) + holiday_month, data=CC)
summary(model2)

## 
## Call:
## lm(formula = log(sales_unitboxes) ~ consumer_sentiment + inflation_rate + 
##     unemp_rate + log(itaee) + pop_density + job_density + log(pop_minwage) + 
##     exchange_rate + I(max_temperature^2) + holiday_month, data = CC)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.08391 -0.03474  0.00128  0.02903  0.12413 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)          -9.119e-01  5.842e+00  -0.156   0.8768    
## consumer_sentiment    7.108e-03  3.945e-03   1.802   0.0797 .  
## inflation_rate        2.778e-02  3.961e-02   0.701   0.4875    
## unemp_rate           -4.072e-01  2.802e+00  -0.145   0.8853    
## log(itaee)            2.997e+00  6.758e-01   4.435 7.96e-05 ***
## pop_density           3.621e-02  6.445e-02   0.562   0.5776    
## job_density          -1.081e-01  6.676e-02  -1.620   0.1138    
## log(pop_minwage)      2.613e-01  2.284e-01   1.144   0.2599    
## exchange_rate        -2.264e-02  1.458e-02  -1.553   0.1290    
## I(max_temperature^2)  5.134e-04  8.448e-05   6.077 4.94e-07 ***
## holiday_month         2.848e-02  2.000e-02   1.424   0.1629    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.05574 on 37 degrees of freedom
## Multiple R-squared:  0.7176, Adjusted R-squared:  0.6412 
## F-statistic:   9.4 on 10 and 37 DF,  p-value: 1.613e-07

For model 2, only 3 variables remain significant. It will be necessary to test these models, in order to interpret the best one, and make some predictions.

D) Results Analysis

Evaluate each regression model using model diagnostics (e.g., multicollinearity and heteroscedasticity).

Model 1

#Hetocedasticity
bptest(model1)

## 
##  studentized Breusch-Pagan test
## 
## data:  model1
## BP = 15.24, df = 13, p-value = 0.2926

m1res<-resid(model1)
plot(fitted(model1),m1res)

Upon examining this graph and considering a p-value of 0.29, we do not have sufficient evidence to reject the null hypothesis (H0). This suggests the presence of homoscedasticity, indicating that the model’s residuals do not exhibit heteroscedasticity.

#Multicollinearity
vif(model1)

## consumer_sentiment                CPI     inflation_rate         unemp_rate 
##           2.302813          93.062556           4.238225           4.736072 
##      gdp_percapita              itaee       itaee_growth        pop_density 
##          48.148366          56.087168           2.179659         338.421913 
##        job_density   log(pop_minwage)      exchange_rate    max_temperature 
##         129.555197           7.368171          12.804899           3.684720 
##      holiday_month 
##           1.388718

This results show some variables with a Variance Inflation Factor (VIF) greater than 10, which suggest the presence of multicollinearity in the model. Indicating that predictor variables are highly correlated with each other.

Model 2

#Hetocedasticity
bptest(model2)

## 
##  studentized Breusch-Pagan test
## 
## data:  model2
## BP = 12.252, df = 10, p-value = 0.2685

m2res<-resid(model2)
plot(fitted(model2),m2res)

Upon examining this graph and considering a p-value of 0.2685, we do not have sufficient evidence to reject the null hypothesis (H0). This suggests the presence of homoscedasticity, indicating that the model’s residuals do not exhibit heteroscedasticity.

#Multicollinearity
vif(model2)

##   consumer_sentiment       inflation_rate           unemp_rate 
##             1.964909             3.603140             4.096399 
##           log(itaee)          pop_density          job_density 
##            12.196889           104.548072           105.638166 
##     log(pop_minwage)        exchange_rate I(max_temperature^2) 
##             6.506213             8.296245             2.923265 
##        holiday_month 
##             1.158825

This results show but less than model1 variables with a Variance Inflation Factor (VIF) greater than 10, which suggest the presence of multicollinearity in the model. Indicating that some predictor variables are highly correlated with each other.

Select the regression model that better fits the data (e.g., AIC and / or RMSE).

AIC(model1,model2)

##        df       AIC
## model1 15 1379.5498
## model2 12 -129.4325

When using AIC as the selection criterion for models, we can observe that Model 2 has the lowest value. Therefore, it is the one that will be used with the aim of having a precise model. However, there are still issues that need to be addressed, such as the presence of multicollinearity for some variables.

#Adjusting model 2
fixed_model<-lm(log(sales_unitboxes) ~ consumer_sentiment + inflation_rate + unemp_rate + log(itaee)+ log(pop_minwage) + exchange_rate + I(max_temperature^2) + holiday_month, data=CC)
vif(fixed_model)

##   consumer_sentiment       inflation_rate           unemp_rate 
##             1.654092             2.974401             2.855593 
##           log(itaee)     log(pop_minwage)        exchange_rate 
##             4.097255             3.476172             5.520924 
## I(max_temperature^2)        holiday_month 
##             2.249282             1.084519

The variables “pop_density” and “job_density” were not highly relevant for this model and prediction. They were the ones showing the highest VIF, indicating higher levels of multicollinearity. That’s why the decision was made to remove them, and now the model no longer exhibits variables with high multicollinearity values.

AIC(fixed_model)

## [1] -125.3375

It still has a low value for AIC.

bptest(fixed_model)

## 
##  studentized Breusch-Pagan test
## 
## data:  fixed_model
## BP = 3.9856, df = 8, p-value = 0.8584

Fixed model has a p-value greater than 0.05, which indicates that there is not enough evidence to reject null hypothesis, which suggest the presence of homocedasticity.

histogram(fixed_model$residuals)

Residuals for this model follows a normal distribution, which suggest that statistically inference might be true.

Interpret the regression results

summary(fixed_model)

## 
## Call:
## lm(formula = log(sales_unitboxes) ~ consumer_sentiment + inflation_rate + 
##     unemp_rate + log(itaee) + log(pop_minwage) + exchange_rate + 
##     I(max_temperature^2) + holiday_month, data = CC)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.10327 -0.03970  0.01222  0.03163  0.12988 
## 
## Coefficients:
##                        Estimate Std. Error t value Pr(>|t|)    
## (Intercept)           7.714e+00  1.801e+00   4.282 0.000117 ***
## consumer_sentiment    6.305e-03  3.835e-03   1.644 0.108219    
## inflation_rate       -6.975e-03  3.814e-02  -0.183 0.855849    
## unemp_rate            3.612e+00  2.479e+00   1.457 0.153216    
## log(itaee)            1.583e+00  4.151e-01   3.813 0.000477 ***
## log(pop_minwage)     -9.278e-02  1.769e-01  -0.524 0.602970    
## exchange_rate        -5.260e-03  1.261e-02  -0.417 0.678765    
## I(max_temperature^2)  4.197e-04  7.853e-05   5.345  4.2e-06 ***
## holiday_month         2.064e-02  2.050e-02   1.006 0.320383    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.05907 on 39 degrees of freedom
## Multiple R-squared:  0.6657, Adjusted R-squared:  0.5971 
## F-statistic: 9.706 on 8 and 39 DF,  p-value: 2.765e-07

In order to understand the results of this model, it is necessary to describe the impact that every explanatory variable has into dependent variable (y). This impact for each variable is:

consumer_sentiment: An increase of one unit in consumer sentiment is associated with an approximately 0.006305 unit increase in the dependent variable (y).
inflation_rate: An increase of one unit in the inflation rate is associated with an approximately -0.006975 unit decrease in the dependent variable (y).
unemp_rate: An increase of one unit in the unemployment rate is associated with an approximately 3.612 unit increase in the dependent variable (y).
log(itaee): An increase of one unit in the logarithm of itaee is associated with an approximately 1.583 unit increase in the dependent variable (y).
log(pop_minwage): An increase of one unit in the logarithm of pop_minwage is associated with an approximately -0.09278 unit decrease in the dependent variable (y).
exchange_rate: An increase of one unit in the exchange rate is associated with an approximately -0.005260 unit decrease in the dependent variable (y).
max_temperature^2: An increase of one unit in the square of max_temperature is associated with an approximately 0.0004197 unit increase in the dependent variable (y).
holiday_month: An increase of one unit in the holiday month variable is associated with an approximately 0.02064 unit increase in the dependent variable (y).

It’s important to emphasize and take into account that the only significant variables for the model are “max_temperature” and “itaee”.

Predictions:

plot(effect("I(max_temperature^2)",fixed_model))

This plots were created in order to make predictions between the X’s regressors and the dependent variable, and to test hypotheses statements established before. Variable max temperature does have a positive relation with dependent variable of sales in units boxes, which indicates that H1 is accepted.

plot(effect("log(itaee)",fixed_model))

Variable itaee does have a positive relation with dependent variable of sales in units boxes, which indicates that H2 is accepted.

plot(effect("inflation_rate",fixed_model))

The effect plot for the inflation variable shows a very slight negative relationship with the dependent variable, but since it is a negative relation, we fail to reject H3.

REFERENCES: Coca-Cola FEMSA / 2016 Annual Report. (2016). Coca-Colafemsa.com. https://coca-colafemsa.com/reportes/reporte-anual-2016/eng/glossary.html

‌

LS0tDQp0aXRsZTogIkV4YW0gcGFydCA0Ig0KYXV0aG9yOiAiSmVzw7pzIERhbmllbCBGYXLDrWFzIEJ1c3RhbWFudGUiDQpkYXRlOiAiMjAyMy0wOS0wOCINCm91dHB1dDoNCiAgaHRtbF9kb2N1bWVudDoNCiAgICB0b2M6IHllcw0KICAgIHRvY19mbG9hdDogeWVzDQogICAgY29kZV9kb3dubG9hZDogeWVzDQotLS0NCmBgYHtyIG1lc3NhZ2U9RkFMU0UsIHdhcm5pbmc9RkFMU0UsIHBhZ2VkLnByaW50PUZBTFNFfQ0KI0xpYnJhcmllcyB1cGxvYWRpbmcNCmxpYnJhcnkodHNlcmllcykNCmxpYnJhcnkocGxvdGx5KQ0KbGlicmFyeSh4dHMpDQpsaWJyYXJ5KGRwbHlyKQ0KbGlicmFyeSh6b28pDQpsaWJyYXJ5KHRzZXJpZXMpDQpsaWJyYXJ5KHN0YXRzKQ0KbGlicmFyeShmb3JlY2FzdCkNCmxpYnJhcnkoYXN0c2EpDQpsaWJyYXJ5KGNvcnJwbG90KQ0KbGlicmFyeShBRVIpDQpsaWJyYXJ5KHZhcnMpDQpsaWJyYXJ5KGR5bmxtKQ0KbGlicmFyeSh2YXJzKQ0KbGlicmFyeShUU3N0dWRpbykNCmxpYnJhcnkodGlkeXZlcnNlKQ0KbGlicmFyeShzYXJpbWEpDQpsaWJyYXJ5KGR5Z3JhcGhzKQ0KbGlicmFyeShUU3N0dWRpbykNCmxpYnJhcnkoZGxvb2tyKQ0KbGlicmFyeShrYWJsZUV4dHJhKQ0KbGlicmFyeShlZmZlY3RzKQ0KbGlicmFyeSh2aXNkYXQpDQpsaWJyYXJ5KGZvcmVpZ24pDQpsaWJyYXJ5KGRwbHlyKSAgICAgICAgIyBkYXRhIG1hbmlwdWxhdGlvbiANCmxpYnJhcnkoZm9yY2F0cykgICAgICAjIHRvIHdvcmsgd2l0aCBjYXRlZ29yaWNhbCB2YXJpYWJsZXMNCmxpYnJhcnkoZ2dwbG90MikgICAgICAjIGRhdGEgdmlzdWFsaXphdGlvbiANCmxpYnJhcnkocmVhZHIpICAgICAgICAjIHJlYWQgc3BlY2lmaWMgY3N2IGZpbGVzDQpsaWJyYXJ5KGphbml0b3IpICAgICAgIyBkYXRhIGV4cGxvcmF0aW9uIGFuZCBjbGVhbmluZyANCmxpYnJhcnkoSG1pc2MpICAgICAgICAjIHNldmVyYWwgdXNlZnVsIGZ1bmN0aW9ucyBmb3IgZGF0YSBhbmFseXNpcyANCmxpYnJhcnkocHN5Y2gpICAgICAgICAjIGZ1bmN0aW9ucyBmb3IgbXVsdGl2YXJpYXRlIGFuYWx5c2lzIA0KbGlicmFyeShuYW5pYXIpICAgICAgICMgc3VtbWFyaWVzIGFuZCB2aXN1YWxpemF0aW9uIG9mIG1pc3NpbmcgdmFsdWVzIE5Bcw0KbGlicmFyeShkbG9va3IpICAgICAgICMgc3VtbWFyaWVzIGFuZCB2aXN1YWxpemF0aW9uIG9mIG1pc3NpbmcgdmFsdWVzIE5Bcw0KbGlicmFyeShjb3JycGxvdCkgICAgICMgY29ycmVsYXRpb24gcGxvdHMNCmxpYnJhcnkoanRvb2xzKSAgICAgICAjIHByZXNlbnRhdGlvbiBvZiByZWdyZXNzaW9uIGFuYWx5c2lzIA0KbGlicmFyeShsbXRlc3QpICAgICAgICMgZGlhZ25vc3RpYyBjaGVja3MgLSBsaW5lYXIgcmVncmVzc2lvbiBhbmFseXNpcyANCmxpYnJhcnkoY2FyKSAgICAgICAgICAjIGRpYWdub3N0aWMgY2hlY2tzIC0gbGluZWFyIHJlZ3Jlc3Npb24gYW5hbHlzaXMNCmxpYnJhcnkoa2FibGVFeHRyYSkgICAjIEhUTUwgdGFibGUgYXR0cmlidXRlcw0KbGlicmFyeSh0aWR5dmVyc2UpDQpsaWJyYXJ5KGNhcmV0KQ0KbGlicmFyeShnbG1uZXQpDQpsaWJyYXJ5KE1ldHJpY3MpDQpgYGANCg0KYGBge3J9DQpDQyA8LSByZWFkLmNzdigiQzpcXFVzZXJzXFxkYW55YlxcT25lRHJpdmUgLSBJbnN0aXR1dG8gVGVjbm9sb2dpY28geSBkZSBFc3R1ZGlvcyBTdXBlcmlvcmVzIGRlIE1vbnRlcnJleVxcRG9jc1xcRG9jdW1lbnRvc1xcQnVzaW5lc3MgSW50ZWxsaWdlbmNlXFxRdWludG8gU2VtZXN0cmVcXEludHJvZHVjdGlvbiB0byBFY29ub21ldHJpY3NcXEV4YW1lblxcY29jYWNvbGEuY3N2IikNCmBgYA0KDQoNCiMgKipBKSBFeHBsb3JhdG9yeSBEYXRhIEFuYWx5c2lzIChFREEpKioNCiMjIEJyaWVmbHkgZGVzY3JpYmUgdGhlIGRhdGFzZXQuIEZvciBleGFtcGxlLCB3aGF0IGlzIHRoZSBzdHJ1Y3R1cmUgb2YgdGhlIGRhdGFzZXQ/IEhvdyBtYW55IG9ic2VydmF0aW9ucyBpbmNsdWRlIHRoZSBkYXRhc2V0PyBJcyB0aGVyZSBhbnkgcHJlc2VuY2Ugb2YgbWlzc2luZyB2YWx1ZXMgaW4gdGhlIGRhdGFzZXQ/DQoNCmNvY2EtY29sYSBkYXRhc2V0IHdpbGwgYmUgdXNlZCBmb3IgdGhpcyBhbmFseXNpcw0KDQoqKlRoZSBDb2NhLUNvbGEgQ29tcGFueToqKiAqIkZvdW5kZWQgaW4gMTg4NiwgVGhlIENvY2EtQ29sYSBDb21wYW55IGlzIHRoZSB3b3JsZOKAmXMgbGFyZ2VzdCBiZXZlcmFnZSBjb21wYW55LCByZWZyZXNoaW5nIGNvbnN1bWVycyB3aXRoIG1vcmUgdGhhbiA1MDAgc3BhcmtsaW5nIGFuZCBzdGlsbCBicmFuZHMuIFRoZSBDb2NhLUNvbGEgQ29tcGFueeKAmXMgY29ycG9yYXRlIGhlYWRxdWFydGVycyBhcmUgaW4gQXRsYW50YSB3aXRoIGxvY2FsIG9wZXJhdGlvbnMgaW4gbW9yZSB0aGFuIDIwMCBjb3VudHJpZXMgYXJvdW5kIHRoZSB3b3JsZCIuKiAgKENvY2EtQ29sYSBGRU1TQSAvIDIwMTYgQW5udWFsIFJlcG9ydCwgMjAxNikNCg0KVmFyaWFibGVzIGZvciB0aGlzIGRhdGEgc2V0IGFyZSB0aGUgZm9sbG93aW5nOg0KDQoqKnRwZXJpb2Q6KiogZGF0ZQ0KDQoqKnNhbGVzX3VuaXRib3hlcwlkZXBlbmRlbnQgdmFyaWFibGU6Kiogc2FsZXMgY29jYS1jb2xhIHVuaXQgYm94ZXMNCg0KKipjb25zdW1lcl9zZW50aW1lbnQ6KioJaG93IGNvbnN1bWVycyBmZWVsIGFib3V0IHRoZSBzdGF0ZSBvZiB0aGUgZWNvbm9teQ0KDQoqKkNQSToqKgljb25zdW1lciBwcmljZSBpbmRleCAyMDE4PTEwMA0KDQoqKmluZmxhdGlvbl9yYXRlOioqCWNoYW5nZSBpbiB0aGUgY29uc3VtZXIgcHJpY2UgaW5kZXggMjAxOD0xMDANCg0KKip1bmVtcF9yYXRlOioqCXBlcmNlbnRhZ2Ugb2YgdGhlIGxhYm9yIGZvcmNlIHRoYXQgaXMgdW5lbXBsb3llZA0KDQoqKmdkcF9wZXJjYXBpdGE6KioJZ3Jvc3MgZG9tZXN0aWMgcG9wdWxhdGlvbiBieSBwb3B1bGF0aW9uDQoNCioqaXRhZWU6KioJSW5kaWNhdG9yIG9mIHRoZSBTdGF0ZSBFY29ub21pYyBBY3Rpdml0eSAtIElUQUVFDQoNCioqaXRhZWVfZ3Jvd3RoOioqCWl0YWVlJ3MgZ3Jvd3RoIHJhdGUgDQoNCioqcG9wX2RlbnNpdHk6KioJcG9wdWxhdGlvbiBwZXIga20yDQoNCioqam9iX2RlbnNpdHk6KioJZW1wbG95ZWQgcG9wdWxhdGlvbiBwZXIga20yDQoNCioqcG9wX21pbndhZ2U6KioJcG9wdWxhdGlvbiBwZXIga20yIGVhcm5pbmcgMS0yIG1pbml1bXVtIHdhZ2VzDQoNCioqZXhjaGFuZ2VfcmF0ZToqKglleGNoYW5nZSByYXRlIFUuUy4gLSBNWE4NCg0KKiptYXhfdGVtcGVyYXR1cmU6KioJYXZlcmFnZSBtYXggdGVtcGVyYXR1cmUgDQoNCioqaG9saWRheV9tb250aDoqKgkxIGlmIG1vbnRoIGluY2x1ZGVzIGEgaG9saWRheSB3ZWVrIGluY2x1ZGluZzogcHVibGljIGhvbGlkYXksIGVhc3RlciBob2xpZGF5LCBhbmQgY2hyaXN0bWFzOyAwIG90aGVyd2lzZQ0KDQoNCg0KYGBge3J9DQpzdHIoQ0MpDQpgYGANCg0KDQpJdCBpcyBwb3NzaWJsZSB0byBzZWUgdGhhdCB0aGUgZGF0YSBzZXQgbW9zdGx5IGhhcyBudW1lcmljIHZhcmlhYmxlcywgZXhjZXB0IGZvciBwcmVpb2QsIG1heF90ZW1wZXJhdHVyZSBhbmQgaG9saWRheV9tb250aC4gSXQgd2lsbCBiZSBuZWNlc3NhcnkgdG8gdHJhbnNmb3JtIHNvbWUgb2YgdGhlbS4NCg0KDQpgYGB7cn0NCkNDJHRwZXJpb2QgPC0gYXMuRGF0ZShDQyR0cGVyaW9kLCBmb3JtYXQgPSAieXl5eS1tbS1kZCIpICNDT1JSRUNUIEZPUk1BVCBGT1IgREFURVMNCkNDJG1heF90ZW1wZXJhdHVyZTwtYXMubnVtZXJpYyhDQyRtYXhfdGVtcGVyYXR1cmUpIyBJbiBvcmRlciB0byBtYWtlIHNvbWUgcGxvdHMsIGl0IG5lZWRzIHRvIGJlIG51bWVyaWMuDQpgYGANCg0KDQpgYGB7cn0NCmRpbShDQykNCmBgYA0KDQpUaGUgZGF0YXNldCBpbmNsdWRlcyA0OCBvYnNlcnZhdGlvbnMsIGFuZCAxNSBkaWZmZXJlbnQgdmFyaWFibGVzLg0KDQpgYGB7cn0NCnN1bShpcy5uYShDQykpDQpgYGANCg0KVGhlcmUgYXJlIG5vIG1pc3NpbmcgdmFsdWVzIGZvciB0aGlzIGRhdGFzZXQuDQoNCg0KIyMgSW5jbHVkZSBzdW1tYXJ5IG9mIGRlc2NyaXB0aXZlIHN0YXRpc3RpY3MuIFdoYXQgaXMgdGhlIG1lYW4sIG1pbiwgYW5kIG1heCB2YWx1ZXMgb2YgdGhlIGRlcGVuZGVudCB2YXJpYWJsZT8NCg0KYGBge3J9DQpzdW1tYXJ5KENDKQ0KYGBgDQoNCg0KTG9va2luZyBhdCB0aGlzIHN1bW1hcnksIGl0IGlzIHBvc3NpYmxlIHRvIGlkZW50aWZ5IHRoYXQgdGhlcmUgYXJlIG5vdCBvdXRsaWVycyBmb3IgdGhpcyBkYXRhIHNldC4gQWxsIHRoZSB2YXJpYWJsZXMgaGF2ZSBhIHNpbWlsYXIgdmFsdWUgZm9yIHRoZWlyIG1lYW4gYW5kIG1lZGlhbi4NClZhbHVlcyBmb3IgZGVwZW5kZW50IHZhcmlhYmxlIGFyZToNCg0KKiAqKm1pbjoqKiA1MzAxNzU1DQoqICoqbWVkaWFuOioqIDY0NjEzNTcNCiogKiptZWFuOioqIDY0NzM2OTENCiogKiptYXg6KiogNzk2MzA2Mw0KDQoNCiMgKipCKSBEYXRhIFZpc3VhbGl6YXRpb24qKg0KDQojIyBTaG93IGF0IGxlYXN0IDQtNSBwbG90cyBpbmNsdWRpbmcgcGFpci13aXNlZCBncmFwaHMsIGZyZXF1ZW5jeSBwbG90cywgY29ycmVsYXRpb24gbWF0cml4IHBsb3RzLCBzY2F0dGVyIHBsb3RzLCBib3ggcGxvdHMsIGFuZCAvIG9yIGhpc3RvZ3JhbSBwbG90cywgZXRjLg0KDQoNCmBgYHtyfQ0KdHNwbG90KENDJHNhbGVzX3VuaXRib3hlcykNCmBgYA0KDQpJdCBpcyBpbnRlcmVzdGluZyB0byBzZWUgaG93IGluIHRoaXMgdGltZSBzZXJpZXMgcGxvdCwgc2FsZXMgaW4gdW5pdCBib3hlcyBzZWVtcyB0byBoYXZlIGFuIHN0YXRpb25hbCBwYXR0ZXJuLCB3aXRoIHJpc2VzIGFuZCBmYWxscy4NCg0KDQpgYGB7cn0NCmdncGxvdChDQywgYWVzKHggPSBpbmZsYXRpb25fcmF0ZSwgeSA9IHNhbGVzX3VuaXRib3hlcykpICsNCiAgZ2VvbV9wb2ludCgpICsNCiAgZ2VvbV9zbW9vdGgobWV0aG9kID0gImxtIiwgc2UgPSBGQUxTRSkgKw0KICBsYWJzKHggPSAiSW5mbGF0aW9uIFJhdGUiLA0KICAgICAgIHkgPSAiU2FsZXMgaW4gYm94IHVuaXRzIiwNCiAgICAgICB0aXRsZSA9ICJSZWxhdGlvbiBiZXR3ZWVuIFNhbGVzIGFuZCBJbmZsYXRpb24gUmF0ZSIpDQpgYGANCg0KSXQgaXMgcG9zc2libGUgdG8gaWRlbnRpZnkgdHdvIGRpZmZlcmVudCB0aGluZ3MgaW4gdGhpcyBncmFwaDoNCg0KKiBJbmZsYXRpb24gcmF0ZSBzZWVtcyB0byBoYXZlIGEgbmVnYXRpdmUgcmVsYXRpb24gd2l0aCBzYWxlcy4NCg0KKiBUaGUgbWFqb3JpdHkgb2YgaW5mbGF0aW9uIHJhdGUgc2VlbXMgdG8gYmUgb24gdGhlIGxlZnQgc2lkZSBvZiB0aGUgZ3JhcGgsIHdoaWNoIGNvdWxkIGJlIGEgbGVmdC1za2V3ZWQgZGlzdHJpYnV0aW9uLg0KDQoNCmBgYHtyfQ0KcGFyKG1mcm93PWMoMywgNCkpDQoNCmhpc3QoQ0Mkc2FsZXNfdW5pdGJveGVzKSAjIGxvZw0KaGlzdChDQyRjb25zdW1lcl9zZW50aW1lbnQpDQpoaXN0KENDJENQSSkgI05vdA0KaGlzdChDQyRpbmZsYXRpb25fcmF0ZSkgI2xvZw0KaGlzdChDQyR1bmVtcF9yYXRlKQ0KaGlzdChDQyRpdGFlZSkgI2xvZw0KaGlzdChDQyRpdGFlZV9ncm93dGgpICNOb3QNCmhpc3QoQ0MkcG9wX2RlbnNpdHkpDQpoaXN0KENDJGpvYl9kZW5zaXR5KQ0KaGlzdChDQyRwb3BfbWlud2FnZSkgI2xvZw0KaGlzdChDQyRtYXhfdGVtcGVyYXR1cmUpDQpoaXN0KENDJGV4Y2hhbmdlX3JhdGUpDQoNCmBgYA0KDQpUaGlzIGhpc3RvZ3JhbSdzIG1hdHJpeCB3ZXJlIGRvbmUgd2l0aCB0aGUgaW50ZW50aW9uIG9mIGRldGVjdGluZyBub24gbm9ybWFsIGRpc3RyaWJ1dGlvbiBpbiB0aGUgdmFyaWFibGVzIGZvciB0aGUgZGF0YXNldC4gSWYgYSBub3JtYWwgZGlzdHJpYnV0aW9uIGlzIG5vdCBvYnNlcnZlZCBpbiBvbmUgb3IgbW9yZSB2YXJpYWJsZXMsIGl0IGNvdWxkIGJlIGFuIG9wdGlvbiB0byB0cmFuc2Zvcm0gdGhlbSBpbnRvIHRoZWlyIGxvZyB2YWx1ZS4gQW4gZXhhbXBsZSBmb3IgdGhpcyBhcmUgdGhlIHZhcmlhYmxlcyAiaW5mbGF0aW9uX3JhdGUiLCAiaXRhZWUiLCAicG9wX21pbndhZ2UiLCBhbW9uZyBvdGhlcnMuDQoNCg0KYGBge3J9DQpDQzEgPC0gQ0MgJT4lIGRwbHlyOjpzZWxlY3QoLWhvbGlkYXlfbW9udGgsIC10cGVyaW9kKQ0KY29ycnBsb3QoY29yKENDMSksIHR5cGUgPSAndXBwZXInLCBvcmRlciA9ICdoY2x1c3QnLCBhZGRDb2VmLmNvbCA9ICdibGFjaycsIHRsLmNleCA9IDAuOSwgdGwuc3J0ID0gOTAsIG1hciA9IGMoMCwwLDAsMCksbnVtYmVyLmNleD0xKQ0KYGBgDQoNCg0KVGhpcyBjb3JyZWxhdGlvbiBwbG90IHNob3dzIHRoZSByZWxhdGlvbnNoaXAgYmV0d2VlbiB2YXJpYWJsZXMgaW4gdGhlIGRhdGFzZXQuIEl0IGlzIGltcG9ydGFudCB0byBmaW5kIHdoaWNoIG9mIHRoZXNlIHZhcmlhYmxlcyBoYXZlIHNpZ25pZmljYW50IGNvcnJlbGF0aW9uIHdpdGggZGVwZW5kZW50IHZhcmlhYmxlICJzYWxlc191bml0Ym94ZXMiLiBUaGUgaGlnaGVzdCBjb3JyZWxhdGVkIHZhcmlhYmxlcyB3aXRoIGRlcGVuZGVudCB2YXJpYWJsZXMgYXJlOg0KDQoNCiogKiptYXhfdGVtcGVyYXR1cmUqKiB3aXRoIGEgMC41NyB2YWx1ZS4NCiogKippbmZsYXRpb25fcmF0ZSoqIHdpdGggYSAtMC4zNCB2YWx1ZSAobmVnYXRpdmUgcmVsYXRpb24pLg0KKiAqKml0YWVlKiogd2l0aCBhIDAuMzIgdmFsdWUuDQoNCg0KSXQgaXMgcmVsZXZhbnQgdG8gdW5kZXJzdGFuZCB0aGF0IGNvcnJlbGF0aW9uIGlzIG5vdCB0aGUgc2FtZSBhcyByZWdyZXNzaW9uLCB0aGlzIHBsb3QgY291bGQgZ2l2ZSBhIGZldyBwYXJhbWV0ZXJzIHRvIHN0YXJ0IGVzdGltYXRpbmcgYSBtb2RlbCwgYnV0IHNpZ25pZmljYXRpdmUgdmFyaWFibGVzIGZvciBhbiBhY2N1cmF0ZSBtb2RlbCBjb3VsZCBub3QgYmUgdGhlIG1vc3QgY29ycmVsYXRlZCBvbmVzLg0KDQoNCiMjIFNlbGVjdCAxLTIgcGxvdHMgYW5kIGJyaWVmbHkgZGVzY3JpYmUgdGhlIGRhdGEgcGF0dGVybnMuDQogKEkgZGVzY3JpYmVkIHRoZSA0IGdyYXBocyBJIG1hZGUpDQoNCg0KIyAqKkMpIExpbmVhciBSZWdyZXNzaW9uIE1vZGVsIHNwZWNpZmljYXRpb24qKg0KDQojIyBCcmllZmx5IGRlc2NyaWJlIHRoZSBoeXBvdGhlc2VzIHN0YXRlbWVudHMuIFRoYXQgaXMsIHdoYXQgaXMgdGhlIGV4cGVjdGVkIGltcGFjdCBvZiB0aGUgZXhwbGFuYXRvcnkgdmFyaWFibGUgWCBvbiB0aGUgZGVwZW5kZW50IHZhcmlhYmxlIFkuDQoNCg0KKiBIMTogSXQgbWlnaHQgYmUgZXhwZWN0ZWQgYSBwb3NpdGl2ZSByZWxhdGlvbiBiZXR3ZWVuIG1heCB0ZW1wZXJhdHVyZSBhbmQgZGVwZW5kZW50IHZhcmlhYmxlIHNhbGVzIHVuaXQgYm94ZXMuDQoNCg0KKiBIMjogSXQgbWlnaHQgYmUgZXhwZWN0ZWQgYSBwb3NpdGl2ZSByZWxhdGlvbiBiZXR3ZWVuIGl0YWVlIGFuZCBzYWxlcyB1bml0IGJveGVzLg0KDQoNCiogSDM6IEl0IG1pZ2h0IGJlIGV4cGVjdGVkIGEgbmVnYXRpdmUgcmVsYXRpb24gYmV0d2VlbiBpbmZsYXRpb24gcmF0ZSBhbmQgc2FsZXMgdW5pdCBib3hlcy4NCg0KDQojIyBFc3RpbWF0ZSAyIGRpZmZlcmVudCBtdWx0aXBsZSBsaW5lYXIgcmVncmVzc2lvbiBtb2RlbCBzcGVjaWZpY2F0aW9ucy4NCg0KDQojIyMgTW9kZWwgMToNCmBgYHtyfQ0KbW9kZWwxPC1sbShzYWxlc191bml0Ym94ZXMgfiBjb25zdW1lcl9zZW50aW1lbnQgKyBDUEkgKyBpbmZsYXRpb25fcmF0ZSArIHVuZW1wX3JhdGUrIGdkcF9wZXJjYXBpdGEgKyBpdGFlZSArIGl0YWVlX2dyb3d0aCArIHBvcF9kZW5zaXR5ICsgam9iX2RlbnNpdHkgKyBsb2cocG9wX21pbndhZ2UpICsgZXhjaGFuZ2VfcmF0ZSArIG1heF90ZW1wZXJhdHVyZSArIGhvbGlkYXlfbW9udGgsIGRhdGE9Q0MpDQpzdW1tYXJ5KG1vZGVsMSkNCmBgYA0KDQoNClRoaXMgbW9kZWwgc2hvd3MgYSBmZXcgc2lnbmlmaWNhbnQgdmFyaWFibGVzLCB3aGVyZSBtYXhfdGVtcGVyYXR1cmUgYXJlIGhpZ2hseSBzaWduaWZpY2FudCwgd2l0aCBhIDk5JSBvZiBzaWduaWZpY2FuY2UuDQoNCg0KIyMjIE1vZGVsIDINCg0KYGBge3J9DQptb2RlbDI8LWxtKGxvZyhzYWxlc191bml0Ym94ZXMpIH4gY29uc3VtZXJfc2VudGltZW50ICsgaW5mbGF0aW9uX3JhdGUgKyB1bmVtcF9yYXRlICsgbG9nKGl0YWVlKSArIHBvcF9kZW5zaXR5ICsgam9iX2RlbnNpdHkgKyBsb2cocG9wX21pbndhZ2UpICsgZXhjaGFuZ2VfcmF0ZSArIEkobWF4X3RlbXBlcmF0dXJlXjIpICsgaG9saWRheV9tb250aCwgZGF0YT1DQykNCnN1bW1hcnkobW9kZWwyKQ0KYGBgDQpGb3IgbW9kZWwgMiwgb25seSAzIHZhcmlhYmxlcyByZW1haW4gc2lnbmlmaWNhbnQuIEl0IHdpbGwgYmUgbmVjZXNzYXJ5IHRvIHRlc3QgdGhlc2UgbW9kZWxzLCBpbiBvcmRlciB0byBpbnRlcnByZXQgdGhlIGJlc3Qgb25lLCBhbmQgbWFrZSBzb21lIHByZWRpY3Rpb25zLg0KDQoNCg0KIyAqKkQpIFJlc3VsdHMgQW5hbHlzaXMqKg0KDQojIyBFdmFsdWF0ZSBlYWNoIHJlZ3Jlc3Npb24gbW9kZWwgdXNpbmcgbW9kZWwgZGlhZ25vc3RpY3MgKGUuZy4sIG11bHRpY29sbGluZWFyaXR5IGFuZCBoZXRlcm9zY2VkYXN0aWNpdHkpLg0KDQojIyMgTW9kZWwgMQ0KDQpgYGB7cn0NCiNIZXRvY2VkYXN0aWNpdHkNCmJwdGVzdChtb2RlbDEpDQpgYGANCg0KYGBge3J9DQptMXJlczwtcmVzaWQobW9kZWwxKQ0KcGxvdChmaXR0ZWQobW9kZWwxKSxtMXJlcykNCmBgYA0KDQoNClVwb24gZXhhbWluaW5nIHRoaXMgZ3JhcGggYW5kIGNvbnNpZGVyaW5nIGEgcC12YWx1ZSBvZiAwLjI5LCB3ZSBkbyBub3QgaGF2ZSBzdWZmaWNpZW50IGV2aWRlbmNlIHRvIHJlamVjdCB0aGUgbnVsbCBoeXBvdGhlc2lzIChIMCkuIFRoaXMgc3VnZ2VzdHMgdGhlIHByZXNlbmNlIG9mIGhvbW9zY2VkYXN0aWNpdHksIGluZGljYXRpbmcgdGhhdCB0aGUgbW9kZWwncyByZXNpZHVhbHMgZG8gbm90IGV4aGliaXQgaGV0ZXJvc2NlZGFzdGljaXR5Lg0KDQoNCmBgYHtyfQ0KI011bHRpY29sbGluZWFyaXR5DQp2aWYobW9kZWwxKQ0KYGBgDQoNClRoaXMgcmVzdWx0cyBzaG93IHNvbWUgdmFyaWFibGVzIHdpdGggYSBWYXJpYW5jZSBJbmZsYXRpb24gRmFjdG9yIChWSUYpIGdyZWF0ZXIgdGhhbiAxMCwgd2hpY2ggc3VnZ2VzdCB0aGUgcHJlc2VuY2Ugb2YgbXVsdGljb2xsaW5lYXJpdHkgaW4gdGhlIG1vZGVsLiBJbmRpY2F0aW5nIHRoYXQgcHJlZGljdG9yIHZhcmlhYmxlcyBhcmUgaGlnaGx5IGNvcnJlbGF0ZWQgd2l0aCBlYWNoIG90aGVyLg0KDQoNCiMjIyBNb2RlbCAyDQoNCmBgYHtyfQ0KI0hldG9jZWRhc3RpY2l0eQ0KYnB0ZXN0KG1vZGVsMikNCmBgYA0KDQpgYGB7cn0NCm0ycmVzPC1yZXNpZChtb2RlbDIpDQpwbG90KGZpdHRlZChtb2RlbDIpLG0ycmVzKQ0KYGBgDQoNCg0KVXBvbiBleGFtaW5pbmcgdGhpcyBncmFwaCBhbmQgY29uc2lkZXJpbmcgYSBwLXZhbHVlIG9mIDAuMjY4NSwgd2UgZG8gbm90IGhhdmUgc3VmZmljaWVudCBldmlkZW5jZSB0byByZWplY3QgdGhlIG51bGwgaHlwb3RoZXNpcyAoSDApLiBUaGlzIHN1Z2dlc3RzIHRoZSBwcmVzZW5jZSBvZiBob21vc2NlZGFzdGljaXR5LCBpbmRpY2F0aW5nIHRoYXQgdGhlIG1vZGVsJ3MgcmVzaWR1YWxzIGRvIG5vdCBleGhpYml0IGhldGVyb3NjZWRhc3RpY2l0eS4NCg0KDQpgYGB7cn0NCiNNdWx0aWNvbGxpbmVhcml0eQ0KdmlmKG1vZGVsMikNCmBgYA0KDQpUaGlzIHJlc3VsdHMgc2hvdyAgYnV0IGxlc3MgdGhhbiBtb2RlbDEgdmFyaWFibGVzIHdpdGggYSBWYXJpYW5jZSBJbmZsYXRpb24gRmFjdG9yIChWSUYpIGdyZWF0ZXIgdGhhbiAxMCwgd2hpY2ggc3VnZ2VzdCB0aGUgcHJlc2VuY2Ugb2YgbXVsdGljb2xsaW5lYXJpdHkgaW4gdGhlIG1vZGVsLiBJbmRpY2F0aW5nIHRoYXQgc29tZSBwcmVkaWN0b3IgdmFyaWFibGVzIGFyZSBoaWdobHkgY29ycmVsYXRlZCB3aXRoIGVhY2ggb3RoZXIuDQoNCg0KDQojIyBTZWxlY3QgdGhlIHJlZ3Jlc3Npb24gbW9kZWwgdGhhdCBiZXR0ZXIgZml0cyB0aGUgZGF0YSAoZS5nLiwgQUlDIGFuZCAvIG9yIFJNU0UpLg0KDQoNCmBgYHtyfQ0KQUlDKG1vZGVsMSxtb2RlbDIpDQpgYGANCg0KDQpXaGVuIHVzaW5nIEFJQyBhcyB0aGUgc2VsZWN0aW9uIGNyaXRlcmlvbiBmb3IgbW9kZWxzLCB3ZSBjYW4gb2JzZXJ2ZSB0aGF0IE1vZGVsIDIgaGFzIHRoZSBsb3dlc3QgdmFsdWUuIFRoZXJlZm9yZSwgaXQgaXMgdGhlIG9uZSB0aGF0IHdpbGwgYmUgdXNlZCB3aXRoIHRoZSBhaW0gb2YgaGF2aW5nIGEgcHJlY2lzZSBtb2RlbC4gSG93ZXZlciwgdGhlcmUgYXJlIHN0aWxsIGlzc3VlcyB0aGF0IG5lZWQgdG8gYmUgYWRkcmVzc2VkLCBzdWNoIGFzIHRoZSBwcmVzZW5jZSBvZiBtdWx0aWNvbGxpbmVhcml0eSBmb3Igc29tZSB2YXJpYWJsZXMuDQoNCg0KYGBge3J9DQojQWRqdXN0aW5nIG1vZGVsIDINCmZpeGVkX21vZGVsPC1sbShsb2coc2FsZXNfdW5pdGJveGVzKSB+IGNvbnN1bWVyX3NlbnRpbWVudCArIGluZmxhdGlvbl9yYXRlICsgdW5lbXBfcmF0ZSArIGxvZyhpdGFlZSkrIGxvZyhwb3BfbWlud2FnZSkgKyBleGNoYW5nZV9yYXRlICsgSShtYXhfdGVtcGVyYXR1cmVeMikgKyBob2xpZGF5X21vbnRoLCBkYXRhPUNDKQ0KdmlmKGZpeGVkX21vZGVsKQ0KYGBgDQoNCg0KVGhlIHZhcmlhYmxlcyAicG9wX2RlbnNpdHkiIGFuZCAiam9iX2RlbnNpdHkiIHdlcmUgbm90IGhpZ2hseSByZWxldmFudCBmb3IgdGhpcyBtb2RlbCBhbmQgcHJlZGljdGlvbi4gVGhleSB3ZXJlIHRoZSBvbmVzIHNob3dpbmcgdGhlIGhpZ2hlc3QgVklGLCBpbmRpY2F0aW5nIGhpZ2hlciBsZXZlbHMgb2YgbXVsdGljb2xsaW5lYXJpdHkuIFRoYXQncyB3aHkgdGhlIGRlY2lzaW9uIHdhcyBtYWRlIHRvIHJlbW92ZSB0aGVtLCBhbmQgbm93IHRoZSBtb2RlbCBubyBsb25nZXIgZXhoaWJpdHMgdmFyaWFibGVzIHdpdGggaGlnaCBtdWx0aWNvbGxpbmVhcml0eSB2YWx1ZXMuDQoNCmBgYHtyfQ0KQUlDKGZpeGVkX21vZGVsKQ0KYGBgDQpJdCBzdGlsbCBoYXMgYSBsb3cgdmFsdWUgZm9yIEFJQy4NCg0KDQpgYGB7cn0NCmJwdGVzdChmaXhlZF9tb2RlbCkNCmBgYA0KRml4ZWQgbW9kZWwgaGFzIGEgcC12YWx1ZSBncmVhdGVyIHRoYW4gMC4wNSwgd2hpY2ggaW5kaWNhdGVzIHRoYXQgdGhlcmUgaXMgbm90IGVub3VnaCBldmlkZW5jZSB0byByZWplY3QgbnVsbCBoeXBvdGhlc2lzLCB3aGljaCBzdWdnZXN0IHRoZSBwcmVzZW5jZSBvZiBob21vY2VkYXN0aWNpdHkuDQoNCg0KYGBge3J9DQpoaXN0b2dyYW0oZml4ZWRfbW9kZWwkcmVzaWR1YWxzKQ0KYGBgDQoNClJlc2lkdWFscyBmb3IgdGhpcyBtb2RlbCBmb2xsb3dzIGEgbm9ybWFsIGRpc3RyaWJ1dGlvbiwgd2hpY2ggc3VnZ2VzdCB0aGF0IHN0YXRpc3RpY2FsbHkgaW5mZXJlbmNlIG1pZ2h0IGJlIHRydWUuDQoNCg0KIyMgSW50ZXJwcmV0IHRoZSByZWdyZXNzaW9uIHJlc3VsdHMgDQoNCg0KYGBge3J9DQpzdW1tYXJ5KGZpeGVkX21vZGVsKQ0KYGBgDQoNCg0KSW4gb3JkZXIgdG8gdW5kZXJzdGFuZCB0aGUgcmVzdWx0cyBvZiB0aGlzIG1vZGVsLCBpdCBpcyBuZWNlc3NhcnkgdG8gZGVzY3JpYmUgdGhlIGltcGFjdCB0aGF0IGV2ZXJ5IGV4cGxhbmF0b3J5IHZhcmlhYmxlIGhhcyBpbnRvIGRlcGVuZGVudCB2YXJpYWJsZSAoeSkuIFRoaXMgaW1wYWN0IGZvciBlYWNoIHZhcmlhYmxlIGlzOg0KDQoNCiogKipjb25zdW1lcl9zZW50aW1lbnQ6KiogQW4gaW5jcmVhc2Ugb2Ygb25lIHVuaXQgaW4gY29uc3VtZXIgc2VudGltZW50IGlzIGFzc29jaWF0ZWQgd2l0aCBhbiBhcHByb3hpbWF0ZWx5IDAuMDA2MzA1IHVuaXQgaW5jcmVhc2UgaW4gdGhlIGRlcGVuZGVudCB2YXJpYWJsZSAoeSkuDQoqICoqaW5mbGF0aW9uX3JhdGU6KiogQW4gaW5jcmVhc2Ugb2Ygb25lIHVuaXQgaW4gdGhlIGluZmxhdGlvbiByYXRlIGlzIGFzc29jaWF0ZWQgd2l0aCBhbiBhcHByb3hpbWF0ZWx5IC0wLjAwNjk3NSB1bml0IGRlY3JlYXNlIGluIHRoZSBkZXBlbmRlbnQgdmFyaWFibGUgKHkpLg0KKiAqKnVuZW1wX3JhdGU6KiogQW4gaW5jcmVhc2Ugb2Ygb25lIHVuaXQgaW4gdGhlIHVuZW1wbG95bWVudCByYXRlIGlzIGFzc29jaWF0ZWQgd2l0aCBhbiBhcHByb3hpbWF0ZWx5IDMuNjEyIHVuaXQgaW5jcmVhc2UgaW4gdGhlIGRlcGVuZGVudCB2YXJpYWJsZSAoeSkuDQoqICoqbG9nKGl0YWVlKToqKiBBbiBpbmNyZWFzZSBvZiBvbmUgdW5pdCBpbiB0aGUgbG9nYXJpdGhtIG9mIGl0YWVlIGlzIGFzc29jaWF0ZWQgd2l0aCBhbiBhcHByb3hpbWF0ZWx5IDEuNTgzIHVuaXQgaW5jcmVhc2UgaW4gdGhlIGRlcGVuZGVudCB2YXJpYWJsZSAoeSkuDQoqICoqbG9nKHBvcF9taW53YWdlKToqKiBBbiBpbmNyZWFzZSBvZiBvbmUgdW5pdCBpbiB0aGUgbG9nYXJpdGhtIG9mIHBvcF9taW53YWdlIGlzIGFzc29jaWF0ZWQgd2l0aCBhbiBhcHByb3hpbWF0ZWx5IC0wLjA5Mjc4IHVuaXQgZGVjcmVhc2UgaW4gdGhlIGRlcGVuZGVudCB2YXJpYWJsZSAoeSkuDQoqICoqZXhjaGFuZ2VfcmF0ZToqKiBBbiBpbmNyZWFzZSBvZiBvbmUgdW5pdCBpbiB0aGUgZXhjaGFuZ2UgcmF0ZSBpcyBhc3NvY2lhdGVkIHdpdGggYW4gYXBwcm94aW1hdGVseSAtMC4wMDUyNjAgdW5pdCBkZWNyZWFzZSBpbiB0aGUgZGVwZW5kZW50IHZhcmlhYmxlICh5KS4NCiogKiptYXhfdGVtcGVyYXR1cmVeMjoqKiBBbiBpbmNyZWFzZSBvZiBvbmUgdW5pdCBpbiB0aGUgc3F1YXJlIG9mIG1heF90ZW1wZXJhdHVyZSBpcyBhc3NvY2lhdGVkIHdpdGggYW4gYXBwcm94aW1hdGVseSAwLjAwMDQxOTcgdW5pdCBpbmNyZWFzZSBpbiB0aGUgZGVwZW5kZW50IHZhcmlhYmxlICh5KS4NCiogKipob2xpZGF5X21vbnRoOioqIEFuIGluY3JlYXNlIG9mIG9uZSB1bml0IGluIHRoZSBob2xpZGF5IG1vbnRoIHZhcmlhYmxlIGlzIGFzc29jaWF0ZWQgd2l0aCBhbiBhcHByb3hpbWF0ZWx5IDAuMDIwNjQgdW5pdCBpbmNyZWFzZSBpbiB0aGUgZGVwZW5kZW50IHZhcmlhYmxlICh5KS4NCg0KSXQncyBpbXBvcnRhbnQgdG8gZW1waGFzaXplIGFuZCB0YWtlIGludG8gYWNjb3VudCB0aGF0IHRoZSBvbmx5IHNpZ25pZmljYW50IHZhcmlhYmxlcyBmb3IgdGhlIG1vZGVsIGFyZSAibWF4X3RlbXBlcmF0dXJlIiBhbmQgIml0YWVlIi4NCg0KIyMgUHJlZGljdGlvbnM6DQoNCg0KYGBge3J9DQpwbG90KGVmZmVjdCgiSShtYXhfdGVtcGVyYXR1cmVeMikiLGZpeGVkX21vZGVsKSkNCmBgYA0KDQpUaGlzIHBsb3RzIHdlcmUgY3JlYXRlZCBpbiBvcmRlciB0byBtYWtlIHByZWRpY3Rpb25zIGJldHdlZW4gdGhlIFjigJlzIHJlZ3Jlc3NvcnMgYW5kIHRoZSBkZXBlbmRlbnQgdmFyaWFibGUsIGFuZCB0byB0ZXN0IGh5cG90aGVzZXMgc3RhdGVtZW50cyBlc3RhYmxpc2hlZCBiZWZvcmUuDQpWYXJpYWJsZSBtYXggdGVtcGVyYXR1cmUgZG9lcyBoYXZlIGEgcG9zaXRpdmUgcmVsYXRpb24gd2l0aCBkZXBlbmRlbnQgdmFyaWFibGUgb2Ygc2FsZXMgaW4gdW5pdHMgYm94ZXMsIHdoaWNoIGluZGljYXRlcyB0aGF0IEgxIGlzIGFjY2VwdGVkLg0KDQoNCmBgYHtyfQ0KcGxvdChlZmZlY3QoImxvZyhpdGFlZSkiLGZpeGVkX21vZGVsKSkNCmBgYA0KDQpWYXJpYWJsZSBpdGFlZSBkb2VzIGhhdmUgYSBwb3NpdGl2ZSByZWxhdGlvbiB3aXRoIGRlcGVuZGVudCB2YXJpYWJsZSBvZiBzYWxlcyBpbiB1bml0cyBib3hlcywgd2hpY2ggaW5kaWNhdGVzIHRoYXQgSDIgaXMgYWNjZXB0ZWQuDQoNCmBgYHtyfQ0KcGxvdChlZmZlY3QoImluZmxhdGlvbl9yYXRlIixmaXhlZF9tb2RlbCkpDQpgYGANCg0KVGhlIGVmZmVjdCBwbG90IGZvciB0aGUgaW5mbGF0aW9uIHZhcmlhYmxlIHNob3dzIGEgdmVyeSBzbGlnaHQgbmVnYXRpdmUgcmVsYXRpb25zaGlwIHdpdGggdGhlIGRlcGVuZGVudCB2YXJpYWJsZSwgYnV0IHNpbmNlIGl0IGlzIGEgbmVnYXRpdmUgcmVsYXRpb24sIHdlIGZhaWwgdG8gcmVqZWN0IEgzLg0KDQoqKlJFRkVSRU5DRVM6KioNCkNvY2EtQ29sYSBGRU1TQSAvIDIwMTYgQW5udWFsIFJlcG9ydC4gKDIwMTYpLiBDb2NhLUNvbGFmZW1zYS5jb20uIGh0dHBzOi8vY29jYS1jb2xhZmVtc2EuY29tL3JlcG9ydGVzL3JlcG9ydGUtYW51YWwtMjAxNi9lbmcvZ2xvc3NhcnkuaHRtbA0KDQrigIw=

Exam part 4

Jesús Daniel Farías Bustamante

2023-09-08

A) Exploratory Data Analysis (EDA)

Briefly describe the dataset. For example, what is the structure of the dataset? How many observations include the dataset? Is there any presence of missing values in the dataset?

Include summary of descriptive statistics. What is the mean, min, and max values of the dependent variable?

B) Data Visualization

Show at least 4-5 plots including pair-wised graphs, frequency plots, correlation matrix plots, scatter plots, box plots, and / or histogram plots, etc.

Select 1-2 plots and briefly describe the data patterns.

C) Linear Regression Model specification

Briefly describe the hypotheses statements. That is, what is the expected impact of the explanatory variable X on the dependent variable Y.

Estimate 2 different multiple linear regression model specifications.

Model 1:

Model 2

D) Results Analysis

Evaluate each regression model using model diagnostics (e.g., multicollinearity and heteroscedasticity).

Model 1

Model 2

Select the regression model that better fits the data (e.g., AIC and / or RMSE).

Interpret the regression results

Predictions: