Introduction

Coca-Cola FEMSA, the second-largest Coca-Cola bottler in Latin America and one of the world’s most significant, serves over 118 million consumers across Mexico, Argentina, Ecuador, the United States, and Peru. With a broad product portfolio, it plays a crucial role in meeting consumer demand, including in the Guadalajara Metropolitan Area, where predictive sales models are being developed to enhance strategic decision-making.
Linear regression analysis is a powerful tool in business intelligence for identifying and quantifying relationships between variables. By analyzing historical data, it helps businesses predict future trends, such as sales, customer demand, or market behavior. This insight enables data-driven decision-making, optimizing strategies like pricing, marketing, and inventory management, ultimately leading to improved operational efficiency and profitability.
The problem situation involves predicting sales in units of boxes for the Guadalajara Metropolitan Area by analyzing various economic and environmental factors. To address this, the project will begin with Exploratory Data Analysis (EDA) to understand the data, followed by hypothesis development to explore relationships between variables. Various regression models, including multiple linear, polynomial, Lasso, and Ridge regressions, will be employed to estimate and refine the predictive models. Finally, diagnostic tests and accuracy metrics will be used to select the best model and interpret the results for strategic decision-making.

Exloratory data analysis (EDA)

# missing values in each column
vis_miss(cocacola)

# Display the structure of the dataset
str(cocacola)

## tibble [48 × 15] (S3: tbl_df/tbl/data.frame)
##  $ tperiod           : POSIXct[1:48], format: "2021-01-15" "2021-02-15" ...
##  $ sales_unitboxes   : num [1:48] 5516689 5387496 5886747 6389182 6448275 ...
##  $ consumer_sentiment: num [1:48] 38.1 37.5 38.5 37.8 38 ...
##  $ CPI               : num [1:48] 87.1 87.3 87.6 87.4 87 ...
##  $ inflation_rate    : num [1:48] -0.09 0.19 0.41 -0.26 -0.5 0.17 0.15 0.21 0.37 0.51 ...
##  $ unemp_rate        : num [1:48] 0.0523 0.0531 0.0461 0.051 0.0552 ...
##  $ gdp_percapita     : num [1:48] 11660 11660 11660 11626 11626 ...
##  $ itaee             : num [1:48] 104 104 104 108 108 ...
##  $ itaee_growth      : num [1:48] 0.0497 0.0497 0.0497 0.0318 0.0318 ...
##  $ pop_density       : num [1:48] 98.5 98.5 98.5 98.8 98.8 ...
##  $ job_density       : num [1:48] 18.3 18.5 18.6 18.7 18.7 ...
##  $ pop_minwage       : num [1:48] 9.66 9.66 9.66 9.59 9.59 ...
##  $ exchange_rate     : num [1:48] 14.7 14.9 15.2 15.2 15.3 ...
##  $ max_temperature   : num [1:48] 28 31 29 32 34 32 29 29 29 29 ...
##  $ holiday_month     : num [1:48] 0 0 0 1 0 0 0 0 1 0 ...

# Convert 'holiday_month' to a factor
cocacola$holiday_month <- as.factor(cocacola$holiday_month)

# Convert 'tperiod' to a Date object if it isn't already one
cocacola$tperiod <- as.Date(cocacola$tperiod, format = "%d-%m-%Y")

# Extract the day (which represents the year) and the month
day_month <- format(cocacola$tperiod, "%d-%m")

# Convert the day to a proper year (e.g., 0015 to 2015) and create the correct date
corrected_year <- as.numeric(substr(day_month, 1, 2)) + 2000
corrected_month_day <- paste0(corrected_year, "-", substr(day_month, 4, 5))

# Convert back to Date object
cocacola$tperiod <- as.Date(paste0(corrected_month_day, "-01"), format = "%Y-%m-%d")

# Check the results
head(cocacola$tperiod)

## [1] "2015-01-01" "2015-02-01" "2015-03-01" "2015-04-01" "2015-05-01"
## [6] "2015-06-01"

# structure after conversions
str(cocacola)

## tibble [48 × 15] (S3: tbl_df/tbl/data.frame)
##  $ tperiod           : Date[1:48], format: "2015-01-01" "2015-02-01" ...
##  $ sales_unitboxes   : num [1:48] 5516689 5387496 5886747 6389182 6448275 ...
##  $ consumer_sentiment: num [1:48] 38.1 37.5 38.5 37.8 38 ...
##  $ CPI               : num [1:48] 87.1 87.3 87.6 87.4 87 ...
##  $ inflation_rate    : num [1:48] -0.09 0.19 0.41 -0.26 -0.5 0.17 0.15 0.21 0.37 0.51 ...
##  $ unemp_rate        : num [1:48] 0.0523 0.0531 0.0461 0.051 0.0552 ...
##  $ gdp_percapita     : num [1:48] 11660 11660 11660 11626 11626 ...
##  $ itaee             : num [1:48] 104 104 104 108 108 ...
##  $ itaee_growth      : num [1:48] 0.0497 0.0497 0.0497 0.0318 0.0318 ...
##  $ pop_density       : num [1:48] 98.5 98.5 98.5 98.8 98.8 ...
##  $ job_density       : num [1:48] 18.3 18.5 18.6 18.7 18.7 ...
##  $ pop_minwage       : num [1:48] 9.66 9.66 9.66 9.59 9.59 ...
##  $ exchange_rate     : num [1:48] 14.7 14.9 15.2 15.2 15.3 ...
##  $ max_temperature   : num [1:48] 28 31 29 32 34 32 29 29 29 29 ...
##  $ holiday_month     : Factor w/ 2 levels "0","1": 1 1 1 2 1 1 1 1 2 1 ...

sales_unitboxes: This is the dependent variable. Understanding its distribution helps identify patterns, outliers, or trends over time.
inflation_rate: Inflation affects consumer purchasing power, which can influence sales. High inflation might reduce consumer spending, lowering sales, while low inflation could boost sales.
exchange_rate: Fluctuations in the exchange rate can impact costs, especially if raw materials or finished goods are imported. This, in turn, can influence pricing strategies and sales volumes.
consumer_sentiment: This measures how consumers feel about the economy, which can affect their willingness to spend on non-essential items like soft drinks. Positive sentiment often correlates with higher sales.
unemp_rate: Higher unemployment typically means lower disposable income for consumers, which can negatively impact sales. Understanding this variable helps in assessing the impact of economic conditions on sales.

# Compute basic descriptive statistics using summary
summary_stats <- summary(cocacola[, c("sales_unitboxes", "inflation_rate", "exchange_rate", "consumer_sentiment", "unemp_rate")])

# Display the basic summary statistics
print(summary_stats)

##  sales_unitboxes   inflation_rate    exchange_rate   consumer_sentiment
##  Min.   :5301755   Min.   :-0.5000   Min.   :14.69   Min.   :28.67     
##  1st Qu.:6171767   1st Qu.: 0.1650   1st Qu.:17.38   1st Qu.:35.64     
##  Median :6461357   Median : 0.3850   Median :18.62   Median :36.76     
##  Mean   :6473691   Mean   : 0.3485   Mean   :18.18   Mean   :37.15     
##  3rd Qu.:6819782   3rd Qu.: 0.5575   3rd Qu.:19.06   3rd Qu.:38.14     
##  Max.   :7963063   Max.   : 1.7000   Max.   :21.39   Max.   :44.87     
##    unemp_rate     
##  Min.   :0.03466  
##  1st Qu.:0.04010  
##  Median :0.04369  
##  Mean   :0.04442  
##  3rd Qu.:0.04897  
##  Max.   :0.05517

# Compute additional descriptive statistics using describe function from psych package
describe_stats <- describe(cocacola[, c("sales_unitboxes", "inflation_rate", "exchange_rate", "consumer_sentiment", "unemp_rate")])

# Display the additional descriptive statistics
print(describe_stats)

## cocacola[, c("sales_unitboxes", "inflation_rate", "exchange_rate", "consumer_sentiment", "unemp_rate")] 
## 
##  5  Variables      48  Observations
## --------------------------------------------------------------------------------
## sales_unitboxes 
##        n  missing distinct     Info     Mean      Gmd      .05      .10 
##       48        0       48        1  6473691   680321  5491459  5576844 
##      .25      .50      .75      .90      .95 
##  6171767  6461357  6819782  7288957  7396022 
## 
## lowest : 5301750 5387500 5477870 5516690 5568550
## highest: 7330140 7345040 7423480 7457470 7963060
## --------------------------------------------------------------------------------
## inflation_rate 
##        n  missing distinct     Info     Mean      Gmd      .05      .10 
##       48        0       41    0.999   0.3485   0.4164  -0.3330  -0.1900 
##      .25      .50      .75      .90      .95 
##   0.1650   0.3850   0.5575   0.6510   0.8255 
## 
## lowest : -0.5  -0.45 -0.34 -0.32 -0.26, highest: 0.7   0.78  0.85  1.03  1.7  
## --------------------------------------------------------------------------------
## exchange_rate 
##        n  missing distinct     Info     Mean      Gmd      .05      .10 
##       48        0       48        1    18.18    1.797    15.23    15.42 
##      .25      .50      .75      .90      .95 
##    17.38    18.62    19.06    20.16    20.30 
## 
## lowest : 14.6926 14.9213 15.2262 15.2283 15.2645
## highest: 20.2612 20.2905 20.3032 20.5206 21.3853
## --------------------------------------------------------------------------------
## consumer_sentiment 
##        n  missing distinct     Info     Mean      Gmd      .05      .10 
##       48        0       48        1    37.15    3.041    33.93    34.63 
##      .25      .50      .75      .90      .95 
##    35.64    36.76    38.14    41.81    42.84 
## 
## lowest : 28.6679 31.5156 33.7951 34.1893 34.3367
## highest: 42.1327 42.533  43.0057 43.3411 44.8654
## --------------------------------------------------------------------------------
## unemp_rate 
##        n  missing distinct     Info     Mean      Gmd      .05      .10 
##       48        0       48        1  0.04442 0.006762  0.03648  0.03747 
##      .25      .50      .75      .90      .95 
##  0.04010  0.04369  0.04897  0.05373  0.05413 
## 
## lowest : 0.0346622 0.0358722 0.0364139 0.0365965 0.0367783
## highest: 0.0538359 0.0539483 0.0542306 0.0547338 0.0551745
## --------------------------------------------------------------------------------

# Create a density plot for the sales_unitboxes variable
ggplot(cocacola, aes(x = sales_unitboxes)) +
  geom_density(fill = "blue", alpha = 0.7) +
  labs(title = "Density Plot of Coca-Cola Sales (Unit Boxes)",
       x = "Sales Unit Boxes",
       y = "Density") +
  theme_minimal()

# Scatter plot between sales_unitboxes and inflation_rate
ggplot(cocacola, aes(x = inflation_rate, y = sales_unitboxes)) +
  geom_point(color = "blue") +
  labs(title = "Sales vs. Inflation Rate",
       x = "Inflation Rate",
       y = "Sales (Unit Boxes)") +
  theme_minimal()

# Scatter plot between sales_unitboxes and consumer_sentiment
ggplot(cocacola, aes(x = consumer_sentiment, y = sales_unitboxes)) +
  geom_point(color = "green") +
  labs(title = "Sales vs. Consumer Sentiment",
       x = "Consumer Sentiment",
       y = "Sales (Unit Boxes)") +
  theme_minimal()

# Histogram of sales_unitboxes
ggplot(cocacola, aes(x = sales_unitboxes)) +
  geom_histogram(binwidth = 50000, fill = "blue", color = "black", alpha = 2) +
  labs(title = "Histogram of Coca-Cola Sales (Unit Boxes)",
       x = "Sales Unit Boxes",
       y = "Frequency") +
  theme_minimal()

# Categorize unemployment rate into "Low", "Medium", and "High"
cocacola$unemp_rate_category <- cut(cocacola$unemp_rate, 
                                    breaks = quantile(cocacola$unemp_rate, probs = c(0, 0.33, 0.67, 1), na.rm = TRUE),
                                    labels = c("Low", "Medium", "High"),
                                    include.lowest = TRUE)

# Boxplot of sales by unemployment rate category
ggplot(cocacola, aes(x = unemp_rate_category, y = sales_unitboxes, fill = unemp_rate_category)) +
  geom_boxplot() +
  labs(title = "Sales Distribution by Unemployment Rate",
       x = "Unemployment Rate Category",
       y = "Sales (Unit Boxes)") +
  theme_minimal() +
  scale_fill_manual(values = c("lightblue", "lightgreen", "red"))

# Select relevant numeric variables
numeric_vars <- cocacola[, sapply(cocacola, is.numeric)]

# Calculate correlation matrix
cor_matrix <- cor(numeric_vars, use = "complete.obs")

# Create a correlation plot
corrplot(cor_matrix, method = "color", type = "upper", 
         tl.col = "black", tl.cex = 0.8, 
         title = "Correlation Plot", 
         mar=c(0,0,1,0))

# Scatter plot of sales vs. max_temperature with a smoother
ggplot(cocacola, aes(x = max_temperature, y = sales_unitboxes)) +
  geom_point(color = "pink") +
  geom_smooth(method = "loess", color = "blue") +
  labs(title = "Sales vs. Maximum Temperature",
       x = "Maximum Temperature (°C)",
       y = "Sales (Unit Boxes)") +
  theme_minimal()

## `geom_smooth()` using formula = 'y ~ x'

# Time series plot of sales_unitboxes over time
ggplot(cocacola, aes(x = tperiod, y = sales_unitboxes)) +
  geom_line(color = "blue") +
  labs(title = "Coca-Cola Sales Over Time",
       x = "Time Period",
       y = "Sales (Unit Boxes)") +
  theme_minimal() +
  scale_x_date(date_labels = "%Y-%m", date_breaks = "4 months")

# Perform the Augmented Dickey-Fuller Test
adf_result <- adf.test(cocacola$sales_unitboxes, alternative = "stationary")

## Warning in adf.test(cocacola$sales_unitboxes, alternative = "stationary"):
## p-value smaller than printed p-value

# Display the result
print(adf_result)

## 
##  Augmented Dickey-Fuller Test
## 
## data:  cocacola$sales_unitboxes
## Dickey-Fuller = -4.4282, Lag order = 3, p-value = 0.01
## alternative hypothesis: stationary

sales_ts <- ts(cocacola$sales_unitboxes, start = c(2015, 1), frequency = 12)

# Decompose the time series
decomposed_sales <- decompose(sales_ts)

# Plot the decomposition
plot(decomposed_sales)

Hypotheses Statements

Hypothesis:

Higher temperatures are associated with increased Coca-Cola sales in the Guadalajara Metropolitan Area.

Explanation:

The hypothesis suggests that as temperatures rise, Coca-Cola sales will increase. This relationship is grounded in consumer behavior and market dynamics, where higher temperatures typically drive demand for cold and refreshing beverages like soft drinks. During hotter months, people are more likely to seek out drinks to cool down, leading to increased sales. This pattern is particularly evident in regions with warmer climates or during seasonal peaks like summer, when the consumption of cold drinks tends to surge.

Hypothesis:

Higher GDP per capita is associated with increased Coca-Cola sales in the Guadalajara Metropolitan Area.

Explanation:

This hypothesis suggests that as GDP per capita increases, indicating higher average income levels, Coca-Cola sales will also rise. Higher GDP per capita generally reflects greater economic prosperity, which can lead to increased consumer spending on both essential and non-essential goods, including beverages like Coca-Cola. As people’s disposable income grows, they are more likely to indulge in such products, driving sales upward in the region.

Hypothesis:

Positive consumer sentiment is associated with higher Coca-Cola sales in the Guadalajara Metropolitan Area.

Explanation:

Consumer sentiment reflects how optimistic or pessimistic consumers feel about the economy, their financial stability, and their future purchasing power. When consumer sentiment is high, people are more confident in their financial situation, leading them to spend more on non-essential goods, including beverages like Coca-Cola. Conversely, when consumer sentiment is low, individuals are more likely to save money and cut back on discretionary purchases.

Multiple Linear Regression

modelo_regresion <- lm(sales_unitboxes ~ consumer_sentiment  + gdp_percapita + pop_density + 
                       max_temperature, data = cocacola)

summary(modelo_regresion)

## 
## Call:
## lm(formula = sales_unitboxes ~ consumer_sentiment + gdp_percapita + 
##     pop_density + max_temperature, data = cocacola)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -779205 -261599   35440  200843  714010 
## 
## Coefficients:
##                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        -2.772e+07  5.913e+06  -4.688 2.79e-05 ***
## consumer_sentiment  3.942e+04  2.131e+04   1.849 0.071288 .  
## gdp_percapita      -2.308e+03  6.289e+02  -3.669 0.000667 ***
## pop_density         5.451e+05  1.230e+05   4.433 6.32e-05 ***
## max_temperature     1.806e+05  2.294e+04   7.872 7.20e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 374600 on 43 degrees of freedom
## Multiple R-squared:  0.6419, Adjusted R-squared:  0.6086 
## F-statistic: 19.27 on 4 and 43 DF,  p-value: 3.807e-09

Polynomial - multiple linear regression

modelo_regresion_polinomial <- lm(sales_unitboxes ~ consumer_sentiment +
                                  gdp_percapita + poly(pop_density, 2) + 
                                  poly(max_temperature, 2), data = cocacola)

summary(modelo_regresion_polinomial)

## 
## Call:
## lm(formula = sales_unitboxes ~ consumer_sentiment + gdp_percapita + 
##     poly(pop_density, 2) + poly(max_temperature, 2), data = cocacola)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -540894 -245141   46915  230242  767398 
## 
## Coefficients:
##                             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)               26192332.6  7244641.1   3.615 0.000813 ***
## consumer_sentiment           88845.8    26264.3   3.383 0.001589 ** 
## gdp_percapita                -1921.7      570.3  -3.369 0.001650 ** 
## poly(pop_density, 2)1      3815475.7  1008644.1   3.783 0.000496 ***
## poly(pop_density, 2)2     -1449081.0   481319.5  -3.011 0.004448 ** 
## poly(max_temperature, 2)1  3040530.6   374009.2   8.130  4.4e-10 ***
## poly(max_temperature, 2)2   806901.8   357052.1   2.260 0.029205 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 333700 on 41 degrees of freedom
## Multiple R-squared:  0.729,  Adjusted R-squared:  0.6893 
## F-statistic: 18.38 on 6 and 41 DF,  p-value: 3.161e-10

Ridge

X <- model.matrix(sales_unitboxes ~ consumer_sentiment + gdp_percapita + pop_density + max_temperature, data = cocacola)[, -1]
y <- cocacola$sales_unitboxes

modelo_ridge <- glmnet(X, y, alpha = 0)

cv_ridge <- cv.glmnet(X, y, alpha = 0)
best_lambda <- cv_ridge$lambda.min

modelo_ridge_final <- glmnet(X, y, alpha = 0, lambda = best_lambda)
coeficientes_ridge <- coef(modelo_ridge_final)
print(coeficientes_ridge)

## 5 x 1 sparse Matrix of class "dgCMatrix"
##                               s0
## (Intercept)        -17580715.971
## consumer_sentiment     51880.120
## gdp_percapita          -1047.997
## pop_density           298031.172
## max_temperature       153600.309

Lasso

X <- model.matrix(sales_unitboxes ~ consumer_sentiment + gdp_percapita + pop_density + max_temperature, data = cocacola)[, -1]
y <- cocacola$sales_unitboxes

modelo_lasso <- glmnet(X, y, alpha = 1)

cv_lasso <- cv.glmnet(X, y, alpha = 1)
best_lambda <- cv_lasso$lambda.min

modelo_lasso_final <- glmnet(X, y, alpha = 1, lambda = best_lambda)
coeficientes_lasso <- coef(modelo_lasso_final)
print(coeficientes_lasso)

## 5 x 1 sparse Matrix of class "dgCMatrix"
##                               s0
## (Intercept)        -27031981.630
## consumer_sentiment     40047.354
## gdp_percapita          -2219.646
## pop_density           528119.040
## max_temperature       178788.683

Model Selection and Results Interpretation

Multicollinearity

vif(modelo_regresion)

## consumer_sentiment      gdp_percapita        pop_density    max_temperature 
##           1.270250           8.367803           8.426768           1.222982

vif(modelo_regresion_polinomial)

##                               GVIF Df GVIF^(1/(2*Df))
## consumer_sentiment        2.430150  1        1.558894
## gdp_percapita             8.669659  1        2.944429
## poly(pop_density, 2)     18.236868  2        2.066510
## poly(max_temperature, 2)  1.423875  2        1.092366

Heteroscedasticity

bptest(modelo_regresion)

## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_regresion
## BP = 1.8308, df = 4, p-value = 0.7668

bptest(modelo_regresion_polinomial)

## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_regresion_polinomial
## BP = 5.0238, df = 6, p-value = 0.5408

Normality of Regression Residuals

shapiro.test(residuals(modelo_regresion))

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(modelo_regresion)
## W = 0.97373, p-value = 0.3515

shapiro.test(residuals(modelo_regresion_polinomial))

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals(modelo_regresion_polinomial)
## W = 0.968, p-value = 0.2115

Autocorrelacion de los residuos

dwtest(modelo_regresion)

## 
##  Durbin-Watson test
## 
## data:  modelo_regresion
## DW = 1.8731, p-value = 0.1713
## alternative hypothesis: true autocorrelation is greater than 0

dwtest(modelo_regresion_polinomial)

## 
##  Durbin-Watson test
## 
## data:  modelo_regresion_polinomial
## DW = 1.8868, p-value = 0.1378
## alternative hypothesis: true autocorrelation is greater than 0

Show the level of accuracy for each linear regression model

# Lineal
pred_regresion <- predict(modelo_regresion, newdata = cocacola)

mse_regresion <- mean((pred_regresion - cocacola$sales_unitboxes)^2)

r2_regresion <- summary(modelo_regresion)$r.squared

rmse_regresion <- sqrt(mse_regresion)

aic_regresion <- AIC(modelo_regresion)


# Polinomial
pred_polinomial <- predict(modelo_regresion_polinomial, newdata = cocacola)

mse_polinomial <- mean((pred_polinomial - cocacola$sales_unitboxes)^2)

r2_polinomial <- summary(modelo_regresion_polinomial)$r.squared

rmse_polinomial <- sqrt(mse_polinomial)

aic_polinomial <- AIC(modelo_regresion_polinomial)

# Ridge
pred_ridge <- predict(modelo_ridge_final, newx = X)

rss_ridge <- sum((pred_ridge - y)^2)  
tss <- sum((y - mean(y))^2)          
r2_ridge <- 1 - (rss_ridge / tss)
mse_ridge <- mean((pred_ridge - y)^2)

rmse_ridge <- sqrt(mse_ridge)

n_parametros_ridge <- sum(coef(modelo_ridge_final) != 0)

rss_ridge <- sum((y - pred_ridge)^2)  
sigma2_ridge <- rss_ridge / length(y)  
log_lik_ridge <- -0.5 * length(y) * (log(2 * pi) + log(sigma2_ridge) + 1)

aic_ridge <- 2 * n_parametros_ridge - 2 * log_lik_ridge

pred_lasso <- predict(modelo_lasso_final, newx = X)

# Lasso
rss_lasso <- sum((pred_lasso - y)^2)  # Residual sum of squares
tss <- sum((y - mean(y))^2)           # Total sum of squares
r2_lasso <- 1 - (rss_lasso / tss)

mse_lasso <- mean((pred_lasso - y)^2)

rmse_lasso <- sqrt(mse_lasso)

n_parametros_lasso <- sum(coef(modelo_lasso_final) != 0)

rss_lasso <- sum((y - pred_lasso)^2)  # Suma de los residuos al cuadrado
sigma2_lasso <- rss_lasso / length(y)  # Estimación de la varianza residual
log_lik_lasso <- -0.5 * length(y) * (log(2 * pi) + log(sigma2_lasso) + 1)

aic_lasso <- 2 * n_parametros_lasso - 2 * log_lik_lasso

cat("Resultados del Modelo Lineal:\n")

## Resultados del Modelo Lineal:

cat("MSE:", mse_regresion, "\n")

## MSE: 125685868520

cat("R^2:", r2_regresion, "\n")

## R^2: 0.6419302

cat("RMSE:", rmse_regresion, "\n")

## RMSE: 354522

cat("AIC:", aic_regresion, "\n\n")

## AIC: 1374.957

cat("Resultados del Modelo Polinomial:\n")

## Resultados del Modelo Polinomial:

cat("MSE:", mse_polinomial, "\n")

## MSE: 95123042885

cat("R^2:", r2_polinomial, "\n")

## R^2: 0.7290014

cat("RMSE:", rmse_polinomial, "\n")

## RMSE: 308420.2

cat("AIC:", aic_polinomial, "\n\n")

## AIC: 1365.583

cat("Resultados del Modelo Ridge:\n")

## Resultados del Modelo Ridge:

cat("MSE:", mse_ridge, "\n")

## MSE: 1.38552e+11

cat("R^2:", r2_ridge, "\n")

## R^2: 0.6052754

cat("RMSE:", rmse_ridge, "\n")

## RMSE: 372225.8

cat("AIC:", aic_ridge, "\n\n")

## AIC: 1377.635

cat("Resultados del Modelo Lasso:\n")

## Resultados del Modelo Lasso:

cat("MSE:", mse_lasso, "\n")

## MSE: 125748172554

cat("R^2:", r2_lasso, "\n")

## R^2: 0.6417527

cat("RMSE:", rmse_lasso, "\n")

## RMSE: 354609.9

cat("AIC:", aic_lasso, "\n\n")

## AIC: 1372.98

resultados <- data.frame(
  Modelo = c("Lineal", "Polinomial", "Ridge", "Lasso"),
  MSE = c(mse_regresion, mse_polinomial, mse_ridge, mse_lasso),
  R2 = c(r2_regresion, r2_polinomial, r2_ridge, r2_lasso),
  RMSE = c(rmse_regresion, rmse_polinomial, rmse_ridge, rmse_lasso),
  AIC = c(aic_regresion, aic_polinomial, aic_ridge, aic_lasso)
)

# Gráfica para MSE
ggplot(resultados, aes(x = Modelo, y = MSE)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  labs(title = "Comparison of MSE between Models", y = "MSE", x = "Model") +
  theme_minimal()

# Gráfica para R^2
ggplot(resultados, aes(x = Modelo, y = R2)) +
  geom_bar(stat = "identity", fill = "darkgreen") +
  labs(title = "Comparison of R^2 between Models", y = "R^2", x = "Model") +
  theme_minimal()

# Gráfica para RMSE
ggplot(resultados, aes(x = Modelo, y = RMSE)) +
  geom_bar(stat = "identity", fill = "coral") +
  labs(title = "Comparison of RMSE between Models", y = "RMSE", x = "Model") +
  theme_minimal()

# Gráfica para AIC
ggplot(resultados, aes(x = Modelo, y = AIC)) +
  geom_bar(stat = "identity", fill = "purple") +
  labs(title = "Comparison of AIC between Models", y = "AIC", x = "Model") +
  theme_minimal()

Conclusion

After making all of the models, and comparing them between each other, we can see that the most accurate is the polynomial model. We can obtain this conclusion based on the RMSE we obtained for all the models. A lower RMSE indicates that the values obtained are closer to the real selling values, and the polynomial model has the lowest by a considerable margin. Apart from this fact, the R2 is the highest on the polynomial model. This indicates that the variability is well-explained by the model. In other more simple words, the data fits the model nicely, and so it makes the most sense to utilize it. The third metric we used is MSE. In this case, I honestly forgot what this metric measured, but after some investigation, I concluded that it measures the accuracy of the model, and similarly to the RMSE, we are looking for the lowest value possible. Similarly to the past metrics, the polynomial model is also the lowest, which is good. Lastly, the AIC is also the lowest in the polynomial model, even if it is by a small margin. Lower AIC means a good balance between fit and complexity in a model, which means that this model is appropriate for the analysis being made.

Here are some insights obtained from the model:

As consumer sentiment increases, sales also increase. This is statistically significant (p = 0.0016) suggesting this variable is a key factor.
The GDP per-capita has a negative correlation with the sales. This seems counter-intuitive, but it may be based around changing consumer patterns.
There is a very significant positive impact in sales when the temperature is higher. This makes sense, considering Coca-Cola is a popular refresher when temperatures are high.
The R2 is of .689, which indicates a good fit, and the F statistic is highly significant, which tells us the model is effective in predicting sales patterns.
The VIF value indicates moderate multicollinearity, mainly for the GDP per Capita variable. This indicates that this variable is correlated to other variables in the model, which can lead to less prediction.
Based on the Breusch-Pagan test, we can conclude that heteroscedasticity isn’t an issue in the model, considering the p-value is of 0.5408 and the BP is of 5.02.

LS0tCnRpdGxlOiAiRXZpZGVuY2UxIgphdXRob3I6ICJBZHJpYW4gTW9yYWxlcyBRdWlyb2dhLCBQYWJsbyBTYW5jaG8gR29uesOhbGV6LCBNaWd1ZWwgQW5nZWwgTG9wZXosIE1hbnVlbCBSYW1pcmV6IgpkYXRlOiAiMjAyNC0wOC0yMiIKb3V0cHV0OiAKICBodG1sX2RvY3VtZW50OgogICAgY29kZV9kb3dubG9hZDogVFJVRQotLS0KCmBgYHtyLCBpbmNsdWRlPUZBTFNFfQpsaWJyYXJ5KGRwbHlyKQpsaWJyYXJ5KHN0cmluZ3IpCmxpYnJhcnkoZ2dwbG90MikKbGlicmFyeShmb3JjYXRzKQpsaWJyYXJ5KERhdGFFeHBsb3JlcikKbGlicmFyeSh2aXNkYXQpCmxpYnJhcnkobWljZSkKbGlicmFyeShzdHJpbmdkaXN0KQpsaWJyYXJ5KGZ1enp5am9pbikKbGlicmFyeShlc3F1aXNzZSkKbGlicmFyeSh3b3JkY2xvdWQpCmxpYnJhcnkodG0pCmxpYnJhcnkobHVicmlkYXRlKQpsaWJyYXJ5KGUxMDcxKQpsaWJyYXJ5KHJlYWR4bCkKbGlicmFyeShuYW5pYXIpCmxpYnJhcnkoR0dhbGx5KQpsaWJyYXJ5KGNhcikKbGlicmFyeShwUk9DKQpsaWJyYXJ5KHJhbmRvbUZvcmVzdCkKbGlicmFyeShnbG1uZXQpCmxpYnJhcnkoUk9TRSkKbGlicmFyeShsbXRlc3QpCmxpYnJhcnkocHN5Y2gpCmxpYnJhcnkoSG1pc2MpCmxpYnJhcnkoY29ycnBsb3QpCmxpYnJhcnkodHNlcmllcykKbGlicmFyeShyZWFkeGwpCmxpYnJhcnkoc3RhdHMpCmBgYAoKCmBgYHtyLCBpbmNsdWRlPUZBTFNFfQpjb2NhY29sYSAgPC0gcmVhZF9leGNlbCgiL1VzZXJzL3BhYmxvc2FuY2hvL0Rlc2t0b3AvY29jYWNvbGFzYWxlcy54bHN4IikKCmBgYAoKIyBJbnRyb2R1Y3Rpb24KCmEuIENvY2EtQ29sYSBGRU1TQSwgdGhlIHNlY29uZC1sYXJnZXN0IENvY2EtQ29sYSBib3R0bGVyIGluIExhdGluIEFtZXJpY2EgYW5kIG9uZSBvZiB0aGUgd29ybGQncyBtb3N0IHNpZ25pZmljYW50LCBzZXJ2ZXMgb3ZlciAxMTggbWlsbGlvbiBjb25zdW1lcnMgYWNyb3NzIE1leGljbywgQXJnZW50aW5hLCBFY3VhZG9yLCB0aGUgVW5pdGVkIFN0YXRlcywgYW5kIFBlcnUuIFdpdGggYSBicm9hZCBwcm9kdWN0IHBvcnRmb2xpbywgaXQgcGxheXMgYSBjcnVjaWFsIHJvbGUgaW4gbWVldGluZyBjb25zdW1lciBkZW1hbmQsIGluY2x1ZGluZyBpbiB0aGUgR3VhZGFsYWphcmEgTWV0cm9wb2xpdGFuIEFyZWEsIHdoZXJlIHByZWRpY3RpdmUgc2FsZXMgbW9kZWxzIGFyZSBiZWluZyBkZXZlbG9wZWQgdG8gZW5oYW5jZSBzdHJhdGVnaWMgZGVjaXNpb24tbWFraW5nLgoKYi4gTGluZWFyIHJlZ3Jlc3Npb24gYW5hbHlzaXMgaXMgYSBwb3dlcmZ1bCB0b29sIGluIGJ1c2luZXNzIGludGVsbGlnZW5jZSBmb3IgaWRlbnRpZnlpbmcgYW5kIHF1YW50aWZ5aW5nIHJlbGF0aW9uc2hpcHMgYmV0d2VlbiB2YXJpYWJsZXMuIEJ5IGFuYWx5emluZyBoaXN0b3JpY2FsIGRhdGEsIGl0IGhlbHBzIGJ1c2luZXNzZXMgcHJlZGljdCBmdXR1cmUgdHJlbmRzLCBzdWNoIGFzIHNhbGVzLCBjdXN0b21lciBkZW1hbmQsIG9yIG1hcmtldCBiZWhhdmlvci4gVGhpcyBpbnNpZ2h0IGVuYWJsZXMgZGF0YS1kcml2ZW4gZGVjaXNpb24tbWFraW5nLCBvcHRpbWl6aW5nIHN0cmF0ZWdpZXMgbGlrZSBwcmljaW5nLCBtYXJrZXRpbmcsIGFuZCBpbnZlbnRvcnkgbWFuYWdlbWVudCwgdWx0aW1hdGVseSBsZWFkaW5nIHRvIGltcHJvdmVkIG9wZXJhdGlvbmFsIGVmZmljaWVuY3kgYW5kIHByb2ZpdGFiaWxpdHkuCgpjLiBUaGUgcHJvYmxlbSBzaXR1YXRpb24gaW52b2x2ZXMgcHJlZGljdGluZyBzYWxlcyBpbiB1bml0cyBvZiBib3hlcyBmb3IgdGhlIEd1YWRhbGFqYXJhIE1ldHJvcG9saXRhbiBBcmVhIGJ5IGFuYWx5emluZyB2YXJpb3VzIGVjb25vbWljIGFuZCBlbnZpcm9ubWVudGFsIGZhY3RvcnMuIFRvIGFkZHJlc3MgdGhpcywgdGhlIHByb2plY3Qgd2lsbCBiZWdpbiB3aXRoIEV4cGxvcmF0b3J5IERhdGEgQW5hbHlzaXMgKEVEQSkgdG8gdW5kZXJzdGFuZCB0aGUgZGF0YSwgZm9sbG93ZWQgYnkgaHlwb3RoZXNpcyBkZXZlbG9wbWVudCB0byBleHBsb3JlIHJlbGF0aW9uc2hpcHMgYmV0d2VlbiB2YXJpYWJsZXMuIFZhcmlvdXMgcmVncmVzc2lvbiBtb2RlbHMsIGluY2x1ZGluZyBtdWx0aXBsZSBsaW5lYXIsIHBvbHlub21pYWwsIExhc3NvLCBhbmQgUmlkZ2UgcmVncmVzc2lvbnMsIHdpbGwgYmUgZW1wbG95ZWQgdG8gZXN0aW1hdGUgYW5kIHJlZmluZSB0aGUgcHJlZGljdGl2ZSBtb2RlbHMuIEZpbmFsbHksIGRpYWdub3N0aWMgdGVzdHMgYW5kIGFjY3VyYWN5IG1ldHJpY3Mgd2lsbCBiZSB1c2VkIHRvIHNlbGVjdCB0aGUgYmVzdCBtb2RlbCBhbmQgaW50ZXJwcmV0IHRoZSByZXN1bHRzIGZvciBzdHJhdGVnaWMgZGVjaXNpb24tbWFraW5nLgoKIyBFeGxvcmF0b3J5IGRhdGEgYW5hbHlzaXMgKEVEQSkKCmBgYHtyfQojIG1pc3NpbmcgdmFsdWVzIGluIGVhY2ggY29sdW1uCnZpc19taXNzKGNvY2Fjb2xhKQpgYGAKCmBgYHtyfQojIERpc3BsYXkgdGhlIHN0cnVjdHVyZSBvZiB0aGUgZGF0YXNldApzdHIoY29jYWNvbGEpCmBgYApgYGB7cn0KIyBDb252ZXJ0ICdob2xpZGF5X21vbnRoJyB0byBhIGZhY3Rvcgpjb2NhY29sYSRob2xpZGF5X21vbnRoIDwtIGFzLmZhY3Rvcihjb2NhY29sYSRob2xpZGF5X21vbnRoKQpgYGAKCmBgYHtyfQojIENvbnZlcnQgJ3RwZXJpb2QnIHRvIGEgRGF0ZSBvYmplY3QgaWYgaXQgaXNuJ3QgYWxyZWFkeSBvbmUKY29jYWNvbGEkdHBlcmlvZCA8LSBhcy5EYXRlKGNvY2Fjb2xhJHRwZXJpb2QsIGZvcm1hdCA9ICIlZC0lbS0lWSIpCgojIEV4dHJhY3QgdGhlIGRheSAod2hpY2ggcmVwcmVzZW50cyB0aGUgeWVhcikgYW5kIHRoZSBtb250aApkYXlfbW9udGggPC0gZm9ybWF0KGNvY2Fjb2xhJHRwZXJpb2QsICIlZC0lbSIpCgojIENvbnZlcnQgdGhlIGRheSB0byBhIHByb3BlciB5ZWFyIChlLmcuLCAwMDE1IHRvIDIwMTUpIGFuZCBjcmVhdGUgdGhlIGNvcnJlY3QgZGF0ZQpjb3JyZWN0ZWRfeWVhciA8LSBhcy5udW1lcmljKHN1YnN0cihkYXlfbW9udGgsIDEsIDIpKSArIDIwMDAKY29ycmVjdGVkX21vbnRoX2RheSA8LSBwYXN0ZTAoY29ycmVjdGVkX3llYXIsICItIiwgc3Vic3RyKGRheV9tb250aCwgNCwgNSkpCgojIENvbnZlcnQgYmFjayB0byBEYXRlIG9iamVjdApjb2NhY29sYSR0cGVyaW9kIDwtIGFzLkRhdGUocGFzdGUwKGNvcnJlY3RlZF9tb250aF9kYXksICItMDEiKSwgZm9ybWF0ID0gIiVZLSVtLSVkIikKCiMgQ2hlY2sgdGhlIHJlc3VsdHMKaGVhZChjb2NhY29sYSR0cGVyaW9kKQpgYGAKCmBgYHtyfQojIHN0cnVjdHVyZSBhZnRlciBjb252ZXJzaW9ucwpzdHIoY29jYWNvbGEpCmBgYAoKLSAqKnNhbGVzX3VuaXRib3hlcyoqOiBUaGlzIGlzIHRoZSBkZXBlbmRlbnQgdmFyaWFibGUuIFVuZGVyc3RhbmRpbmcgaXRzIGRpc3RyaWJ1dGlvbiBoZWxwcyBpZGVudGlmeSBwYXR0ZXJucywgb3V0bGllcnMsIG9yIHRyZW5kcyBvdmVyIHRpbWUuCgotICoqaW5mbGF0aW9uX3JhdGUqKjogSW5mbGF0aW9uIGFmZmVjdHMgY29uc3VtZXIgcHVyY2hhc2luZyBwb3dlciwgd2hpY2ggY2FuIGluZmx1ZW5jZSBzYWxlcy4gSGlnaCBpbmZsYXRpb24gbWlnaHQgcmVkdWNlIGNvbnN1bWVyIHNwZW5kaW5nLCBsb3dlcmluZyBzYWxlcywgd2hpbGUgbG93IGluZmxhdGlvbiBjb3VsZCBib29zdCBzYWxlcy4KCi0gKipleGNoYW5nZV9yYXRlKio6IEZsdWN0dWF0aW9ucyBpbiB0aGUgZXhjaGFuZ2UgcmF0ZSBjYW4gaW1wYWN0IGNvc3RzLCBlc3BlY2lhbGx5IGlmIHJhdyBtYXRlcmlhbHMgb3IgZmluaXNoZWQgZ29vZHMgYXJlIGltcG9ydGVkLiBUaGlzLCBpbiB0dXJuLCBjYW4gaW5mbHVlbmNlIHByaWNpbmcgc3RyYXRlZ2llcyBhbmQgc2FsZXMgdm9sdW1lcy4KCi0gKipjb25zdW1lcl9zZW50aW1lbnQqKjogVGhpcyBtZWFzdXJlcyBob3cgY29uc3VtZXJzIGZlZWwgYWJvdXQgdGhlIGVjb25vbXksIHdoaWNoIGNhbiBhZmZlY3QgdGhlaXIgd2lsbGluZ25lc3MgdG8gc3BlbmQgb24gbm9uLWVzc2VudGlhbCBpdGVtcyBsaWtlIHNvZnQgZHJpbmtzLiBQb3NpdGl2ZSBzZW50aW1lbnQgb2Z0ZW4gY29ycmVsYXRlcyB3aXRoIGhpZ2hlciBzYWxlcy4KCi0gKip1bmVtcF9yYXRlKio6IEhpZ2hlciB1bmVtcGxveW1lbnQgdHlwaWNhbGx5IG1lYW5zIGxvd2VyIGRpc3Bvc2FibGUgaW5jb21lIGZvciBjb25zdW1lcnMsIHdoaWNoIGNhbiBuZWdhdGl2ZWx5IGltcGFjdCBzYWxlcy4gVW5kZXJzdGFuZGluZyB0aGlzIHZhcmlhYmxlIGhlbHBzIGluIGFzc2Vzc2luZyB0aGUgaW1wYWN0IG9mIGVjb25vbWljIGNvbmRpdGlvbnMgb24gc2FsZXMuCgpgYGB7cn0KIyBDb21wdXRlIGJhc2ljIGRlc2NyaXB0aXZlIHN0YXRpc3RpY3MgdXNpbmcgc3VtbWFyeQpzdW1tYXJ5X3N0YXRzIDwtIHN1bW1hcnkoY29jYWNvbGFbLCBjKCJzYWxlc191bml0Ym94ZXMiLCAiaW5mbGF0aW9uX3JhdGUiLCAiZXhjaGFuZ2VfcmF0ZSIsICJjb25zdW1lcl9zZW50aW1lbnQiLCAidW5lbXBfcmF0ZSIpXSkKCiMgRGlzcGxheSB0aGUgYmFzaWMgc3VtbWFyeSBzdGF0aXN0aWNzCnByaW50KHN1bW1hcnlfc3RhdHMpCgojIENvbXB1dGUgYWRkaXRpb25hbCBkZXNjcmlwdGl2ZSBzdGF0aXN0aWNzIHVzaW5nIGRlc2NyaWJlIGZ1bmN0aW9uIGZyb20gcHN5Y2ggcGFja2FnZQpkZXNjcmliZV9zdGF0cyA8LSBkZXNjcmliZShjb2NhY29sYVssIGMoInNhbGVzX3VuaXRib3hlcyIsICJpbmZsYXRpb25fcmF0ZSIsICJleGNoYW5nZV9yYXRlIiwgImNvbnN1bWVyX3NlbnRpbWVudCIsICJ1bmVtcF9yYXRlIildKQoKIyBEaXNwbGF5IHRoZSBhZGRpdGlvbmFsIGRlc2NyaXB0aXZlIHN0YXRpc3RpY3MKcHJpbnQoZGVzY3JpYmVfc3RhdHMpCmBgYAoKYGBge3J9CiMgQ3JlYXRlIGEgZGVuc2l0eSBwbG90IGZvciB0aGUgc2FsZXNfdW5pdGJveGVzIHZhcmlhYmxlCmdncGxvdChjb2NhY29sYSwgYWVzKHggPSBzYWxlc191bml0Ym94ZXMpKSArCiAgZ2VvbV9kZW5zaXR5KGZpbGwgPSAiYmx1ZSIsIGFscGhhID0gMC43KSArCiAgbGFicyh0aXRsZSA9ICJEZW5zaXR5IFBsb3Qgb2YgQ29jYS1Db2xhIFNhbGVzIChVbml0IEJveGVzKSIsCiAgICAgICB4ID0gIlNhbGVzIFVuaXQgQm94ZXMiLAogICAgICAgeSA9ICJEZW5zaXR5IikgKwogIHRoZW1lX21pbmltYWwoKQpgYGAKCmBgYHtyfQojIFNjYXR0ZXIgcGxvdCBiZXR3ZWVuIHNhbGVzX3VuaXRib3hlcyBhbmQgaW5mbGF0aW9uX3JhdGUKZ2dwbG90KGNvY2Fjb2xhLCBhZXMoeCA9IGluZmxhdGlvbl9yYXRlLCB5ID0gc2FsZXNfdW5pdGJveGVzKSkgKwogIGdlb21fcG9pbnQoY29sb3IgPSAiYmx1ZSIpICsKICBsYWJzKHRpdGxlID0gIlNhbGVzIHZzLiBJbmZsYXRpb24gUmF0ZSIsCiAgICAgICB4ID0gIkluZmxhdGlvbiBSYXRlIiwKICAgICAgIHkgPSAiU2FsZXMgKFVuaXQgQm94ZXMpIikgKwogIHRoZW1lX21pbmltYWwoKQoKIyBTY2F0dGVyIHBsb3QgYmV0d2VlbiBzYWxlc191bml0Ym94ZXMgYW5kIGNvbnN1bWVyX3NlbnRpbWVudApnZ3Bsb3QoY29jYWNvbGEsIGFlcyh4ID0gY29uc3VtZXJfc2VudGltZW50LCB5ID0gc2FsZXNfdW5pdGJveGVzKSkgKwogIGdlb21fcG9pbnQoY29sb3IgPSAiZ3JlZW4iKSArCiAgbGFicyh0aXRsZSA9ICJTYWxlcyB2cy4gQ29uc3VtZXIgU2VudGltZW50IiwKICAgICAgIHggPSAiQ29uc3VtZXIgU2VudGltZW50IiwKICAgICAgIHkgPSAiU2FsZXMgKFVuaXQgQm94ZXMpIikgKwogIHRoZW1lX21pbmltYWwoKQpgYGAKCmBgYHtyfQojIEhpc3RvZ3JhbSBvZiBzYWxlc191bml0Ym94ZXMKZ2dwbG90KGNvY2Fjb2xhLCBhZXMoeCA9IHNhbGVzX3VuaXRib3hlcykpICsKICBnZW9tX2hpc3RvZ3JhbShiaW53aWR0aCA9IDUwMDAwLCBmaWxsID0gImJsdWUiLCBjb2xvciA9ICJibGFjayIsIGFscGhhID0gMikgKwogIGxhYnModGl0bGUgPSAiSGlzdG9ncmFtIG9mIENvY2EtQ29sYSBTYWxlcyAoVW5pdCBCb3hlcykiLAogICAgICAgeCA9ICJTYWxlcyBVbml0IEJveGVzIiwKICAgICAgIHkgPSAiRnJlcXVlbmN5IikgKwogIHRoZW1lX21pbmltYWwoKQpgYGAKCmBgYHtyfQojIENhdGVnb3JpemUgdW5lbXBsb3ltZW50IHJhdGUgaW50byAiTG93IiwgIk1lZGl1bSIsIGFuZCAiSGlnaCIKY29jYWNvbGEkdW5lbXBfcmF0ZV9jYXRlZ29yeSA8LSBjdXQoY29jYWNvbGEkdW5lbXBfcmF0ZSwgCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIGJyZWFrcyA9IHF1YW50aWxlKGNvY2Fjb2xhJHVuZW1wX3JhdGUsIHByb2JzID0gYygwLCAwLjMzLCAwLjY3LCAxKSwgbmEucm0gPSBUUlVFKSwKICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgbGFiZWxzID0gYygiTG93IiwgIk1lZGl1bSIsICJIaWdoIiksCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIGluY2x1ZGUubG93ZXN0ID0gVFJVRSkKCiMgQm94cGxvdCBvZiBzYWxlcyBieSB1bmVtcGxveW1lbnQgcmF0ZSBjYXRlZ29yeQpnZ3Bsb3QoY29jYWNvbGEsIGFlcyh4ID0gdW5lbXBfcmF0ZV9jYXRlZ29yeSwgeSA9IHNhbGVzX3VuaXRib3hlcywgZmlsbCA9IHVuZW1wX3JhdGVfY2F0ZWdvcnkpKSArCiAgZ2VvbV9ib3hwbG90KCkgKwogIGxhYnModGl0bGUgPSAiU2FsZXMgRGlzdHJpYnV0aW9uIGJ5IFVuZW1wbG95bWVudCBSYXRlIiwKICAgICAgIHggPSAiVW5lbXBsb3ltZW50IFJhdGUgQ2F0ZWdvcnkiLAogICAgICAgeSA9ICJTYWxlcyAoVW5pdCBCb3hlcykiKSArCiAgdGhlbWVfbWluaW1hbCgpICsKICBzY2FsZV9maWxsX21hbnVhbCh2YWx1ZXMgPSBjKCJsaWdodGJsdWUiLCAibGlnaHRncmVlbiIsICJyZWQiKSkKCmBgYAoKYGBge3J9CiMgU2VsZWN0IHJlbGV2YW50IG51bWVyaWMgdmFyaWFibGVzCm51bWVyaWNfdmFycyA8LSBjb2NhY29sYVssIHNhcHBseShjb2NhY29sYSwgaXMubnVtZXJpYyldCgojIENhbGN1bGF0ZSBjb3JyZWxhdGlvbiBtYXRyaXgKY29yX21hdHJpeCA8LSBjb3IobnVtZXJpY192YXJzLCB1c2UgPSAiY29tcGxldGUub2JzIikKCiMgQ3JlYXRlIGEgY29ycmVsYXRpb24gcGxvdApjb3JycGxvdChjb3JfbWF0cml4LCBtZXRob2QgPSAiY29sb3IiLCB0eXBlID0gInVwcGVyIiwgCiAgICAgICAgIHRsLmNvbCA9ICJibGFjayIsIHRsLmNleCA9IDAuOCwgCiAgICAgICAgIHRpdGxlID0gIkNvcnJlbGF0aW9uIFBsb3QiLCAKICAgICAgICAgbWFyPWMoMCwwLDEsMCkpCmBgYAoKYGBge3J9CiMgU2NhdHRlciBwbG90IG9mIHNhbGVzIHZzLiBtYXhfdGVtcGVyYXR1cmUgd2l0aCBhIHNtb290aGVyCmdncGxvdChjb2NhY29sYSwgYWVzKHggPSBtYXhfdGVtcGVyYXR1cmUsIHkgPSBzYWxlc191bml0Ym94ZXMpKSArCiAgZ2VvbV9wb2ludChjb2xvciA9ICJwaW5rIikgKwogIGdlb21fc21vb3RoKG1ldGhvZCA9ICJsb2VzcyIsIGNvbG9yID0gImJsdWUiKSArCiAgbGFicyh0aXRsZSA9ICJTYWxlcyB2cy4gTWF4aW11bSBUZW1wZXJhdHVyZSIsCiAgICAgICB4ID0gIk1heGltdW0gVGVtcGVyYXR1cmUgKMKwQykiLAogICAgICAgeSA9ICJTYWxlcyAoVW5pdCBCb3hlcykiKSArCiAgdGhlbWVfbWluaW1hbCgpCmBgYAoKYGBge3J9CiMgVGltZSBzZXJpZXMgcGxvdCBvZiBzYWxlc191bml0Ym94ZXMgb3ZlciB0aW1lCmdncGxvdChjb2NhY29sYSwgYWVzKHggPSB0cGVyaW9kLCB5ID0gc2FsZXNfdW5pdGJveGVzKSkgKwogIGdlb21fbGluZShjb2xvciA9ICJibHVlIikgKwogIGxhYnModGl0bGUgPSAiQ29jYS1Db2xhIFNhbGVzIE92ZXIgVGltZSIsCiAgICAgICB4ID0gIlRpbWUgUGVyaW9kIiwKICAgICAgIHkgPSAiU2FsZXMgKFVuaXQgQm94ZXMpIikgKwogIHRoZW1lX21pbmltYWwoKSArCiAgc2NhbGVfeF9kYXRlKGRhdGVfbGFiZWxzID0gIiVZLSVtIiwgZGF0ZV9icmVha3MgPSAiNCBtb250aHMiKQpgYGAKCmBgYHtyfQojIFBlcmZvcm0gdGhlIEF1Z21lbnRlZCBEaWNrZXktRnVsbGVyIFRlc3QKYWRmX3Jlc3VsdCA8LSBhZGYudGVzdChjb2NhY29sYSRzYWxlc191bml0Ym94ZXMsIGFsdGVybmF0aXZlID0gInN0YXRpb25hcnkiKQoKIyBEaXNwbGF5IHRoZSByZXN1bHQKcHJpbnQoYWRmX3Jlc3VsdCkKYGBgCgpgYGB7cn0Kc2FsZXNfdHMgPC0gdHMoY29jYWNvbGEkc2FsZXNfdW5pdGJveGVzLCBzdGFydCA9IGMoMjAxNSwgMSksIGZyZXF1ZW5jeSA9IDEyKQpgYGAKCmBgYHtyfQojIERlY29tcG9zZSB0aGUgdGltZSBzZXJpZXMKZGVjb21wb3NlZF9zYWxlcyA8LSBkZWNvbXBvc2Uoc2FsZXNfdHMpCgojIFBsb3QgdGhlIGRlY29tcG9zaXRpb24KcGxvdChkZWNvbXBvc2VkX3NhbGVzKQpgYGAKCiMgSHlwb3RoZXNlcyBTdGF0ZW1lbnRzCgojIyBIeXBvdGhlc2lzOgpIaWdoZXIgdGVtcGVyYXR1cmVzIGFyZSBhc3NvY2lhdGVkIHdpdGggaW5jcmVhc2VkIENvY2EtQ29sYSBzYWxlcyBpbiB0aGUgR3VhZGFsYWphcmEgTWV0cm9wb2xpdGFuIEFyZWEuCgojIyMgRXhwbGFuYXRpb246ClRoZSBoeXBvdGhlc2lzIHN1Z2dlc3RzIHRoYXQgYXMgdGVtcGVyYXR1cmVzIHJpc2UsIENvY2EtQ29sYSBzYWxlcyB3aWxsIGluY3JlYXNlLiBUaGlzIHJlbGF0aW9uc2hpcCBpcyBncm91bmRlZCBpbiBjb25zdW1lciBiZWhhdmlvciBhbmQgbWFya2V0IGR5bmFtaWNzLCB3aGVyZSBoaWdoZXIgdGVtcGVyYXR1cmVzIHR5cGljYWxseSBkcml2ZSBkZW1hbmQgZm9yIGNvbGQgYW5kIHJlZnJlc2hpbmcgYmV2ZXJhZ2VzIGxpa2Ugc29mdCBkcmlua3MuIER1cmluZyBob3R0ZXIgbW9udGhzLCBwZW9wbGUgYXJlIG1vcmUgbGlrZWx5IHRvIHNlZWsgb3V0IGRyaW5rcyB0byBjb29sIGRvd24sIGxlYWRpbmcgdG8gaW5jcmVhc2VkIHNhbGVzLiBUaGlzIHBhdHRlcm4gaXMgcGFydGljdWxhcmx5IGV2aWRlbnQgaW4gcmVnaW9ucyB3aXRoIHdhcm1lciBjbGltYXRlcyBvciBkdXJpbmcgc2Vhc29uYWwgcGVha3MgbGlrZSBzdW1tZXIsIHdoZW4gdGhlIGNvbnN1bXB0aW9uIG9mIGNvbGQgZHJpbmtzIHRlbmRzIHRvIHN1cmdlLgoKIyMgSHlwb3RoZXNpczoKSGlnaGVyIEdEUCBwZXIgY2FwaXRhIGlzIGFzc29jaWF0ZWQgd2l0aCBpbmNyZWFzZWQgQ29jYS1Db2xhIHNhbGVzIGluIHRoZSBHdWFkYWxhamFyYSBNZXRyb3BvbGl0YW4gQXJlYS4KCiMjIyBFeHBsYW5hdGlvbjoKVGhpcyBoeXBvdGhlc2lzIHN1Z2dlc3RzIHRoYXQgYXMgR0RQIHBlciBjYXBpdGEgaW5jcmVhc2VzLCBpbmRpY2F0aW5nIGhpZ2hlciBhdmVyYWdlIGluY29tZSBsZXZlbHMsIENvY2EtQ29sYSBzYWxlcyB3aWxsIGFsc28gcmlzZS4gSGlnaGVyIEdEUCBwZXIgY2FwaXRhIGdlbmVyYWxseSByZWZsZWN0cyBncmVhdGVyIGVjb25vbWljIHByb3NwZXJpdHksIHdoaWNoIGNhbiBsZWFkIHRvIGluY3JlYXNlZCBjb25zdW1lciBzcGVuZGluZyBvbiBib3RoIGVzc2VudGlhbCBhbmQgbm9uLWVzc2VudGlhbCBnb29kcywgaW5jbHVkaW5nIGJldmVyYWdlcyBsaWtlIENvY2EtQ29sYS4gQXMgcGVvcGxlJ3MgZGlzcG9zYWJsZSBpbmNvbWUgZ3Jvd3MsIHRoZXkgYXJlIG1vcmUgbGlrZWx5IHRvIGluZHVsZ2UgaW4gc3VjaCBwcm9kdWN0cywgZHJpdmluZyBzYWxlcyB1cHdhcmQgaW4gdGhlIHJlZ2lvbi4KCiMjIEh5cG90aGVzaXM6ClBvc2l0aXZlIGNvbnN1bWVyIHNlbnRpbWVudCBpcyBhc3NvY2lhdGVkIHdpdGggaGlnaGVyIENvY2EtQ29sYSBzYWxlcyBpbiB0aGUgR3VhZGFsYWphcmEgTWV0cm9wb2xpdGFuIEFyZWEuCgojIyMgRXhwbGFuYXRpb246CkNvbnN1bWVyIHNlbnRpbWVudCByZWZsZWN0cyBob3cgb3B0aW1pc3RpYyBvciBwZXNzaW1pc3RpYyBjb25zdW1lcnMgZmVlbCBhYm91dCB0aGUgZWNvbm9teSwgdGhlaXIgZmluYW5jaWFsIHN0YWJpbGl0eSwgYW5kIHRoZWlyIGZ1dHVyZSBwdXJjaGFzaW5nIHBvd2VyLiBXaGVuIGNvbnN1bWVyIHNlbnRpbWVudCBpcyBoaWdoLCBwZW9wbGUgYXJlIG1vcmUgY29uZmlkZW50IGluIHRoZWlyIGZpbmFuY2lhbCBzaXR1YXRpb24sIGxlYWRpbmcgdGhlbSB0byBzcGVuZCBtb3JlIG9uIG5vbi1lc3NlbnRpYWwgZ29vZHMsIGluY2x1ZGluZyBiZXZlcmFnZXMgbGlrZSBDb2NhLUNvbGEuIENvbnZlcnNlbHksIHdoZW4gY29uc3VtZXIgc2VudGltZW50IGlzIGxvdywgaW5kaXZpZHVhbHMgYXJlIG1vcmUgbGlrZWx5IHRvIHNhdmUgbW9uZXkgYW5kIGN1dCBiYWNrIG9uIGRpc2NyZXRpb25hcnkgcHVyY2hhc2VzLgoKCiMgTXVsdGlwbGUgTGluZWFyIFJlZ3Jlc3Npb24KCgpgYGB7cn0KbW9kZWxvX3JlZ3Jlc2lvbiA8LSBsbShzYWxlc191bml0Ym94ZXMgfiBjb25zdW1lcl9zZW50aW1lbnQgICsgZ2RwX3BlcmNhcGl0YSArIHBvcF9kZW5zaXR5ICsgCiAgICAgICAgICAgICAgICAgICAgICAgbWF4X3RlbXBlcmF0dXJlLCBkYXRhID0gY29jYWNvbGEpCgpzdW1tYXJ5KG1vZGVsb19yZWdyZXNpb24pCgpgYGAKIyBQb2x5bm9taWFsIC0gbXVsdGlwbGUgbGluZWFyIHJlZ3Jlc3Npb24KCmBgYHtyfQptb2RlbG9fcmVncmVzaW9uX3BvbGlub21pYWwgPC0gbG0oc2FsZXNfdW5pdGJveGVzIH4gY29uc3VtZXJfc2VudGltZW50ICsKICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIGdkcF9wZXJjYXBpdGEgKyBwb2x5KHBvcF9kZW5zaXR5LCAyKSArIAogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgcG9seShtYXhfdGVtcGVyYXR1cmUsIDIpLCBkYXRhID0gY29jYWNvbGEpCgpzdW1tYXJ5KG1vZGVsb19yZWdyZXNpb25fcG9saW5vbWlhbCkKCmBgYAojIFJpZGdlCmBgYHtyfQpYIDwtIG1vZGVsLm1hdHJpeChzYWxlc191bml0Ym94ZXMgfiBjb25zdW1lcl9zZW50aW1lbnQgKyBnZHBfcGVyY2FwaXRhICsgcG9wX2RlbnNpdHkgKyBtYXhfdGVtcGVyYXR1cmUsIGRhdGEgPSBjb2NhY29sYSlbLCAtMV0KeSA8LSBjb2NhY29sYSRzYWxlc191bml0Ym94ZXMKCm1vZGVsb19yaWRnZSA8LSBnbG1uZXQoWCwgeSwgYWxwaGEgPSAwKQoKY3ZfcmlkZ2UgPC0gY3YuZ2xtbmV0KFgsIHksIGFscGhhID0gMCkKYmVzdF9sYW1iZGEgPC0gY3ZfcmlkZ2UkbGFtYmRhLm1pbgoKbW9kZWxvX3JpZGdlX2ZpbmFsIDwtIGdsbW5ldChYLCB5LCBhbHBoYSA9IDAsIGxhbWJkYSA9IGJlc3RfbGFtYmRhKQpjb2VmaWNpZW50ZXNfcmlkZ2UgPC0gY29lZihtb2RlbG9fcmlkZ2VfZmluYWwpCnByaW50KGNvZWZpY2llbnRlc19yaWRnZSkKCgpgYGAKCiMgTGFzc28KYGBge3J9ClggPC0gbW9kZWwubWF0cml4KHNhbGVzX3VuaXRib3hlcyB+IGNvbnN1bWVyX3NlbnRpbWVudCArIGdkcF9wZXJjYXBpdGEgKyBwb3BfZGVuc2l0eSArIG1heF90ZW1wZXJhdHVyZSwgZGF0YSA9IGNvY2Fjb2xhKVssIC0xXQp5IDwtIGNvY2Fjb2xhJHNhbGVzX3VuaXRib3hlcwoKbW9kZWxvX2xhc3NvIDwtIGdsbW5ldChYLCB5LCBhbHBoYSA9IDEpCgpjdl9sYXNzbyA8LSBjdi5nbG1uZXQoWCwgeSwgYWxwaGEgPSAxKQpiZXN0X2xhbWJkYSA8LSBjdl9sYXNzbyRsYW1iZGEubWluCgptb2RlbG9fbGFzc29fZmluYWwgPC0gZ2xtbmV0KFgsIHksIGFscGhhID0gMSwgbGFtYmRhID0gYmVzdF9sYW1iZGEpCmNvZWZpY2llbnRlc19sYXNzbyA8LSBjb2VmKG1vZGVsb19sYXNzb19maW5hbCkKcHJpbnQoY29lZmljaWVudGVzX2xhc3NvKQoKCmBgYAojIE1vZGVsIFNlbGVjdGlvbiBhbmQgUmVzdWx0cyBJbnRlcnByZXRhdGlvbgoKIyMgTXVsdGljb2xsaW5lYXJpdHkKYGBge3J9CnZpZihtb2RlbG9fcmVncmVzaW9uKQp2aWYobW9kZWxvX3JlZ3Jlc2lvbl9wb2xpbm9taWFsKQpgYGAKCiMjIEhldGVyb3NjZWRhc3RpY2l0eQpgYGB7cn0KYnB0ZXN0KG1vZGVsb19yZWdyZXNpb24pCmJwdGVzdChtb2RlbG9fcmVncmVzaW9uX3BvbGlub21pYWwpCmBgYAoKIyMgTm9ybWFsaXR5IG9mIFJlZ3Jlc3Npb24gUmVzaWR1YWxzCmBgYHtyfQpzaGFwaXJvLnRlc3QocmVzaWR1YWxzKG1vZGVsb19yZWdyZXNpb24pKQpzaGFwaXJvLnRlc3QocmVzaWR1YWxzKG1vZGVsb19yZWdyZXNpb25fcG9saW5vbWlhbCkpCmBgYAoKIyMgQXV0b2NvcnJlbGFjaW9uIGRlIGxvcyByZXNpZHVvcwpgYGB7cn0KZHd0ZXN0KG1vZGVsb19yZWdyZXNpb24pCmR3dGVzdChtb2RlbG9fcmVncmVzaW9uX3BvbGlub21pYWwpCmBgYAoKIyMgU2hvdyB0aGUgbGV2ZWwgb2YgYWNjdXJhY3kgZm9yIGVhY2ggbGluZWFyIHJlZ3Jlc3Npb24gbW9kZWwgCmBgYHtyfQojIExpbmVhbApwcmVkX3JlZ3Jlc2lvbiA8LSBwcmVkaWN0KG1vZGVsb19yZWdyZXNpb24sIG5ld2RhdGEgPSBjb2NhY29sYSkKCm1zZV9yZWdyZXNpb24gPC0gbWVhbigocHJlZF9yZWdyZXNpb24gLSBjb2NhY29sYSRzYWxlc191bml0Ym94ZXMpXjIpCgpyMl9yZWdyZXNpb24gPC0gc3VtbWFyeShtb2RlbG9fcmVncmVzaW9uKSRyLnNxdWFyZWQKCnJtc2VfcmVncmVzaW9uIDwtIHNxcnQobXNlX3JlZ3Jlc2lvbikKCmFpY19yZWdyZXNpb24gPC0gQUlDKG1vZGVsb19yZWdyZXNpb24pCgoKIyBQb2xpbm9taWFsCnByZWRfcG9saW5vbWlhbCA8LSBwcmVkaWN0KG1vZGVsb19yZWdyZXNpb25fcG9saW5vbWlhbCwgbmV3ZGF0YSA9IGNvY2Fjb2xhKQoKbXNlX3BvbGlub21pYWwgPC0gbWVhbigocHJlZF9wb2xpbm9taWFsIC0gY29jYWNvbGEkc2FsZXNfdW5pdGJveGVzKV4yKQoKcjJfcG9saW5vbWlhbCA8LSBzdW1tYXJ5KG1vZGVsb19yZWdyZXNpb25fcG9saW5vbWlhbCkkci5zcXVhcmVkCgpybXNlX3BvbGlub21pYWwgPC0gc3FydChtc2VfcG9saW5vbWlhbCkKCmFpY19wb2xpbm9taWFsIDwtIEFJQyhtb2RlbG9fcmVncmVzaW9uX3BvbGlub21pYWwpCgojIFJpZGdlCnByZWRfcmlkZ2UgPC0gcHJlZGljdChtb2RlbG9fcmlkZ2VfZmluYWwsIG5ld3ggPSBYKQoKcnNzX3JpZGdlIDwtIHN1bSgocHJlZF9yaWRnZSAtIHkpXjIpICAKdHNzIDwtIHN1bSgoeSAtIG1lYW4oeSkpXjIpICAgICAgICAgIApyMl9yaWRnZSA8LSAxIC0gKHJzc19yaWRnZSAvIHRzcykKbXNlX3JpZGdlIDwtIG1lYW4oKHByZWRfcmlkZ2UgLSB5KV4yKQoKcm1zZV9yaWRnZSA8LSBzcXJ0KG1zZV9yaWRnZSkKCm5fcGFyYW1ldHJvc19yaWRnZSA8LSBzdW0oY29lZihtb2RlbG9fcmlkZ2VfZmluYWwpICE9IDApCgpyc3NfcmlkZ2UgPC0gc3VtKCh5IC0gcHJlZF9yaWRnZSleMikgIApzaWdtYTJfcmlkZ2UgPC0gcnNzX3JpZGdlIC8gbGVuZ3RoKHkpICAKbG9nX2xpa19yaWRnZSA8LSAtMC41ICogbGVuZ3RoKHkpICogKGxvZygyICogcGkpICsgbG9nKHNpZ21hMl9yaWRnZSkgKyAxKQoKYWljX3JpZGdlIDwtIDIgKiBuX3BhcmFtZXRyb3NfcmlkZ2UgLSAyICogbG9nX2xpa19yaWRnZQoKcHJlZF9sYXNzbyA8LSBwcmVkaWN0KG1vZGVsb19sYXNzb19maW5hbCwgbmV3eCA9IFgpCgojIExhc3NvCnJzc19sYXNzbyA8LSBzdW0oKHByZWRfbGFzc28gLSB5KV4yKSAgIyBSZXNpZHVhbCBzdW0gb2Ygc3F1YXJlcwp0c3MgPC0gc3VtKCh5IC0gbWVhbih5KSleMikgICAgICAgICAgICMgVG90YWwgc3VtIG9mIHNxdWFyZXMKcjJfbGFzc28gPC0gMSAtIChyc3NfbGFzc28gLyB0c3MpCgptc2VfbGFzc28gPC0gbWVhbigocHJlZF9sYXNzbyAtIHkpXjIpCgpybXNlX2xhc3NvIDwtIHNxcnQobXNlX2xhc3NvKQoKbl9wYXJhbWV0cm9zX2xhc3NvIDwtIHN1bShjb2VmKG1vZGVsb19sYXNzb19maW5hbCkgIT0gMCkKCnJzc19sYXNzbyA8LSBzdW0oKHkgLSBwcmVkX2xhc3NvKV4yKSAgIyBTdW1hIGRlIGxvcyByZXNpZHVvcyBhbCBjdWFkcmFkbwpzaWdtYTJfbGFzc28gPC0gcnNzX2xhc3NvIC8gbGVuZ3RoKHkpICAjIEVzdGltYWNpw7NuIGRlIGxhIHZhcmlhbnphIHJlc2lkdWFsCmxvZ19saWtfbGFzc28gPC0gLTAuNSAqIGxlbmd0aCh5KSAqIChsb2coMiAqIHBpKSArIGxvZyhzaWdtYTJfbGFzc28pICsgMSkKCmFpY19sYXNzbyA8LSAyICogbl9wYXJhbWV0cm9zX2xhc3NvIC0gMiAqIGxvZ19saWtfbGFzc28KCmBgYAoKYGBge3J9CmNhdCgiUmVzdWx0YWRvcyBkZWwgTW9kZWxvIExpbmVhbDpcbiIpCmNhdCgiTVNFOiIsIG1zZV9yZWdyZXNpb24sICJcbiIpCmNhdCgiUl4yOiIsIHIyX3JlZ3Jlc2lvbiwgIlxuIikKY2F0KCJSTVNFOiIsIHJtc2VfcmVncmVzaW9uLCAiXG4iKQpjYXQoIkFJQzoiLCBhaWNfcmVncmVzaW9uLCAiXG5cbiIpCgoKY2F0KCJSZXN1bHRhZG9zIGRlbCBNb2RlbG8gUG9saW5vbWlhbDpcbiIpCmNhdCgiTVNFOiIsIG1zZV9wb2xpbm9taWFsLCAiXG4iKQpjYXQoIlJeMjoiLCByMl9wb2xpbm9taWFsLCAiXG4iKQpjYXQoIlJNU0U6Iiwgcm1zZV9wb2xpbm9taWFsLCAiXG4iKQpjYXQoIkFJQzoiLCBhaWNfcG9saW5vbWlhbCwgIlxuXG4iKQoKCmNhdCgiUmVzdWx0YWRvcyBkZWwgTW9kZWxvIFJpZGdlOlxuIikKY2F0KCJNU0U6IiwgbXNlX3JpZGdlLCAiXG4iKQpjYXQoIlJeMjoiLCByMl9yaWRnZSwgIlxuIikKY2F0KCJSTVNFOiIsIHJtc2VfcmlkZ2UsICJcbiIpCmNhdCgiQUlDOiIsIGFpY19yaWRnZSwgIlxuXG4iKQoKCmNhdCgiUmVzdWx0YWRvcyBkZWwgTW9kZWxvIExhc3NvOlxuIikKY2F0KCJNU0U6IiwgbXNlX2xhc3NvLCAiXG4iKQpjYXQoIlJeMjoiLCByMl9sYXNzbywgIlxuIikKY2F0KCJSTVNFOiIsIHJtc2VfbGFzc28sICJcbiIpCmNhdCgiQUlDOiIsIGFpY19sYXNzbywgIlxuXG4iKQoKCmBgYApgYGB7cn0KcmVzdWx0YWRvcyA8LSBkYXRhLmZyYW1lKAogIE1vZGVsbyA9IGMoIkxpbmVhbCIsICJQb2xpbm9taWFsIiwgIlJpZGdlIiwgIkxhc3NvIiksCiAgTVNFID0gYyhtc2VfcmVncmVzaW9uLCBtc2VfcG9saW5vbWlhbCwgbXNlX3JpZGdlLCBtc2VfbGFzc28pLAogIFIyID0gYyhyMl9yZWdyZXNpb24sIHIyX3BvbGlub21pYWwsIHIyX3JpZGdlLCByMl9sYXNzbyksCiAgUk1TRSA9IGMocm1zZV9yZWdyZXNpb24sIHJtc2VfcG9saW5vbWlhbCwgcm1zZV9yaWRnZSwgcm1zZV9sYXNzbyksCiAgQUlDID0gYyhhaWNfcmVncmVzaW9uLCBhaWNfcG9saW5vbWlhbCwgYWljX3JpZGdlLCBhaWNfbGFzc28pCikKCiMgR3LDoWZpY2EgcGFyYSBNU0UKZ2dwbG90KHJlc3VsdGFkb3MsIGFlcyh4ID0gTW9kZWxvLCB5ID0gTVNFKSkgKwogIGdlb21fYmFyKHN0YXQgPSAiaWRlbnRpdHkiLCBmaWxsID0gInN0ZWVsYmx1ZSIpICsKICBsYWJzKHRpdGxlID0gIkNvbXBhcmlzb24gb2YgTVNFIGJldHdlZW4gTW9kZWxzIiwgeSA9ICJNU0UiLCB4ID0gIk1vZGVsIikgKwogIHRoZW1lX21pbmltYWwoKQoKIyBHcsOhZmljYSBwYXJhIFJeMgpnZ3Bsb3QocmVzdWx0YWRvcywgYWVzKHggPSBNb2RlbG8sIHkgPSBSMikpICsKICBnZW9tX2JhcihzdGF0ID0gImlkZW50aXR5IiwgZmlsbCA9ICJkYXJrZ3JlZW4iKSArCiAgbGFicyh0aXRsZSA9ICJDb21wYXJpc29uIG9mIFJeMiBiZXR3ZWVuIE1vZGVscyIsIHkgPSAiUl4yIiwgeCA9ICJNb2RlbCIpICsKICB0aGVtZV9taW5pbWFsKCkKCiMgR3LDoWZpY2EgcGFyYSBSTVNFCmdncGxvdChyZXN1bHRhZG9zLCBhZXMoeCA9IE1vZGVsbywgeSA9IFJNU0UpKSArCiAgZ2VvbV9iYXIoc3RhdCA9ICJpZGVudGl0eSIsIGZpbGwgPSAiY29yYWwiKSArCiAgbGFicyh0aXRsZSA9ICJDb21wYXJpc29uIG9mIFJNU0UgYmV0d2VlbiBNb2RlbHMiLCB5ID0gIlJNU0UiLCB4ID0gIk1vZGVsIikgKwogIHRoZW1lX21pbmltYWwoKQoKIyBHcsOhZmljYSBwYXJhIEFJQwpnZ3Bsb3QocmVzdWx0YWRvcywgYWVzKHggPSBNb2RlbG8sIHkgPSBBSUMpKSArCiAgZ2VvbV9iYXIoc3RhdCA9ICJpZGVudGl0eSIsIGZpbGwgPSAicHVycGxlIikgKwogIGxhYnModGl0bGUgPSAiQ29tcGFyaXNvbiBvZiBBSUMgYmV0d2VlbiBNb2RlbHMiLCB5ID0gIkFJQyIsIHggPSAiTW9kZWwiKSArCiAgdGhlbWVfbWluaW1hbCgpCgpgYGAKCiMjIENvbmNsdXNpb24KCkFmdGVyIG1ha2luZyBhbGwgb2YgdGhlIG1vZGVscywgYW5kIGNvbXBhcmluZyB0aGVtIGJldHdlZW4gZWFjaCBvdGhlciwgd2UgY2FuIHNlZSB0aGF0IHRoZSBtb3N0IGFjY3VyYXRlIGlzIHRoZSBwb2x5bm9taWFsIG1vZGVsLiBXZSBjYW4gb2J0YWluIHRoaXMgY29uY2x1c2lvbiBiYXNlZCBvbiB0aGUgUk1TRSB3ZSBvYnRhaW5lZCBmb3IgYWxsIHRoZSBtb2RlbHMuIEEgbG93ZXIgUk1TRSBpbmRpY2F0ZXMgdGhhdCB0aGUgdmFsdWVzIG9idGFpbmVkIGFyZSBjbG9zZXIgdG8gdGhlIHJlYWwgc2VsbGluZyB2YWx1ZXMsIGFuZCB0aGUgcG9seW5vbWlhbCBtb2RlbCBoYXMgdGhlIGxvd2VzdCBieSBhIGNvbnNpZGVyYWJsZSBtYXJnaW4uIEFwYXJ0IGZyb20gdGhpcyBmYWN0LCB0aGUgUjIgaXMgdGhlIGhpZ2hlc3Qgb24gdGhlIHBvbHlub21pYWwgbW9kZWwuIFRoaXMgaW5kaWNhdGVzIHRoYXQgdGhlIHZhcmlhYmlsaXR5IGlzIHdlbGwtZXhwbGFpbmVkIGJ5IHRoZSBtb2RlbC4gSW4gb3RoZXIgbW9yZSBzaW1wbGUgd29yZHMsIHRoZSBkYXRhIGZpdHMgdGhlIG1vZGVsIG5pY2VseSwgYW5kIHNvIGl0IG1ha2VzIHRoZSBtb3N0IHNlbnNlIHRvIHV0aWxpemUgaXQuIFRoZSB0aGlyZCBtZXRyaWMgd2UgdXNlZCBpcyBNU0UuIEluIHRoaXMgY2FzZSwgSSBob25lc3RseSBmb3Jnb3Qgd2hhdCB0aGlzIG1ldHJpYyBtZWFzdXJlZCwgYnV0IGFmdGVyIHNvbWUgaW52ZXN0aWdhdGlvbiwgSSBjb25jbHVkZWQgdGhhdCBpdCBtZWFzdXJlcyB0aGUgYWNjdXJhY3kgb2YgdGhlIG1vZGVsLCBhbmQgc2ltaWxhcmx5IHRvIHRoZSBSTVNFLCB3ZSBhcmUgbG9va2luZyBmb3IgdGhlIGxvd2VzdCB2YWx1ZSBwb3NzaWJsZS4gU2ltaWxhcmx5IHRvIHRoZSBwYXN0IG1ldHJpY3MsIHRoZSBwb2x5bm9taWFsIG1vZGVsIGlzIGFsc28gdGhlIGxvd2VzdCwgd2hpY2ggaXMgZ29vZC4gTGFzdGx5LCB0aGUgQUlDIGlzIGFsc28gdGhlIGxvd2VzdCBpbiB0aGUgcG9seW5vbWlhbCBtb2RlbCwgZXZlbiBpZiBpdCBpcyBieSBhIHNtYWxsIG1hcmdpbi4gTG93ZXIgQUlDIG1lYW5zIGEgZ29vZCBiYWxhbmNlIGJldHdlZW4gZml0IGFuZCBjb21wbGV4aXR5IGluIGEgbW9kZWwsIHdoaWNoIG1lYW5zIHRoYXQgdGhpcyBtb2RlbCBpcyBhcHByb3ByaWF0ZSBmb3IgdGhlIGFuYWx5c2lzIGJlaW5nIG1hZGUuCgpIZXJlIGFyZSBzb21lIGluc2lnaHRzIG9idGFpbmVkIGZyb20gdGhlIG1vZGVsOgoKLSBBcyBjb25zdW1lciBzZW50aW1lbnQgaW5jcmVhc2VzLCBzYWxlcyBhbHNvIGluY3JlYXNlLiBUaGlzIGlzIHN0YXRpc3RpY2FsbHkgc2lnbmlmaWNhbnQgKHAgPSAwLjAwMTYpIHN1Z2dlc3RpbmcgdGhpcyB2YXJpYWJsZSBpcyBhIGtleSBmYWN0b3IuCgotIFRoZSBHRFAgcGVyLWNhcGl0YSBoYXMgYSBuZWdhdGl2ZSBjb3JyZWxhdGlvbiB3aXRoIHRoZSBzYWxlcy4gVGhpcyBzZWVtcyBjb3VudGVyLWludHVpdGl2ZSwgYnV0IGl0IG1heSBiZSBiYXNlZCBhcm91bmQgY2hhbmdpbmcgY29uc3VtZXIgcGF0dGVybnMuCgotIFRoZXJlIGlzIGEgdmVyeSBzaWduaWZpY2FudCBwb3NpdGl2ZSBpbXBhY3QgaW4gc2FsZXMgd2hlbiB0aGUgdGVtcGVyYXR1cmUgaXMgaGlnaGVyLiBUaGlzIG1ha2VzIHNlbnNlLCBjb25zaWRlcmluZyBDb2NhLUNvbGEgaXMgYSBwb3B1bGFyIHJlZnJlc2hlciB3aGVuIHRlbXBlcmF0dXJlcyBhcmUgaGlnaC4KCi0gVGhlIFIyIGlzIG9mIC42ODksIHdoaWNoIGluZGljYXRlcyBhIGdvb2QgZml0LCBhbmQgdGhlIEYgc3RhdGlzdGljIGlzIGhpZ2hseSBzaWduaWZpY2FudCwgd2hpY2ggdGVsbHMgdXMgdGhlIG1vZGVsIGlzIGVmZmVjdGl2ZSBpbiBwcmVkaWN0aW5nIHNhbGVzIHBhdHRlcm5zLgoKLSBUaGUgVklGIHZhbHVlIGluZGljYXRlcyBtb2RlcmF0ZSBtdWx0aWNvbGxpbmVhcml0eSwgbWFpbmx5IGZvciB0aGUgR0RQIHBlciBDYXBpdGEgdmFyaWFibGUuIFRoaXMgaW5kaWNhdGVzIHRoYXQgdGhpcyB2YXJpYWJsZSBpcyBjb3JyZWxhdGVkIHRvIG90aGVyIHZhcmlhYmxlcyBpbiB0aGUgbW9kZWwsIHdoaWNoIGNhbiBsZWFkIHRvIGxlc3MgcHJlZGljdGlvbi4KCi0gQmFzZWQgb24gdGhlIEJyZXVzY2gtUGFnYW4gdGVzdCwgd2UgY2FuIGNvbmNsdWRlIHRoYXQgaGV0ZXJvc2NlZGFzdGljaXR5IGlzbid0IGFuIGlzc3VlIGluIHRoZSBtb2RlbCwgY29uc2lkZXJpbmcgdGhlIHAtdmFsdWUgaXMgb2YgMC41NDA4IGFuZCB0aGUgQlAgaXMgb2YgNS4wMi4K

Evidence1

Adrian Morales Quiroga, Pablo Sancho González, Miguel Angel Lopez, Manuel Ramirez

2024-08-22

Introduction

Exloratory data analysis (EDA)

Hypotheses Statements

Hypothesis:

Explanation:

Hypothesis:

Explanation:

Hypothesis:

Explanation:

Multiple Linear Regression

Polynomial - multiple linear regression

Ridge

Lasso

Model Selection and Results Interpretation

Multicollinearity

Heteroscedasticity

Normality of Regression Residuals

Autocorrelacion de los residuos

Show the level of accuracy for each linear regression model

Conclusion