Business Analytics Lab Worksheet 06

Notebook Instructions

About

In this lab, we will focus on linear and non-linear programming.
Linear programming, as discussed in the previous lab, works with simple and multiple linear regression techniques; sometimes the variables have completely direct or completely non-direct relationships and these techniques can model them.
Sometimes, however, the variables do not predict each other in a linear way. For example, looking at the stock market vs. time, we know that generally the market was booming before the crash, then the market crashed and the great depression hit, and slowly the market started to rise again.
This pattern is not linear, and in fact a non-linear programming technique can be used to model it and predict the value of the market based on the year.
In this lab, we will explore topics like optimization, solve a marketing model, and perform linear and non-linear regression on the cost of servers.

Load Packages in R/RStudio

We are going to use tidyverse a collection of R packages designed for data science.

Info: https://www.tidyverse.org/

# Here we are checking if the package is installed
if(!require("tidyverse")){
  
  # If the package is not in the system then it will be install
  install.packages("tidyverse", dependencies = TRUE)
  
  # Here we are loading the package
  library("tidyverse")
}

Loading required package: tidyverse
[30m-- [1mAttaching packages[22m --------------------------------------- tidyverse 1.2.1 --[39m
[30m[32mv[30m [34mggplot2[30m 2.2.1     [32mv[30m [34mpurrr  [30m 0.2.4
[32mv[30m [34mtibble [30m 1.4.2     [32mv[30m [34mdplyr  [30m 0.7.4
[32mv[30m [34mtidyr  [30m 0.7.2     [32mv[30m [34mstringr[30m 1.2.0
[32mv[30m [34mreadr  [30m 1.1.1     [32mv[30m [34mforcats[30m 0.2.0[39m
[30m-- [1mConflicts[22m ------------------------------------------ tidyverse_conflicts() --
[31mx[30m [34mdplyr[30m::[32mfilter()[30m masks [34mstats[30m::filter()
[31mx[30m [34mdplyr[30m::[32mlag()[30m    masks [34mstats[30m::lag()[39m

# Here we are checking if the package is installed
if(!require("plotly")){
  
  # If the package is not in the system then it will be install
  install.packages("plotly", dependencies = TRUE)
  
  # Here we are loading the package
  library("plotly")
}

Loading required package: plotly

Attaching package: <U+393C><U+3E31>plotly<U+393C><U+3E32>

The following object is masked from <U+393C><U+3E31>package:ggplot2<U+393C><U+3E32>:

    last_plot

The following object is masked from <U+393C><U+3E31>package:stats<U+393C><U+3E32>:

    filter

The following object is masked from <U+393C><U+3E31>package:graphics<U+393C><U+3E32>:

    layout

Task 1: Linear Programming - Solving Marketing Model

1A) Create the model object in R.

lprec <- make.lp(0, 2)

Set the constrains and objective function for the model.

Set for maximum

lp.control(lprec, sense="max")

$anti.degen
[1] "fixedvars" "stalling" 

$basis.crash
[1] "none"

$bb.depthlimit
[1] -50

$bb.floorfirst
[1] "automatic"

$bb.rule
[1] "pseudononint" "greedy"       "dynamic"      "rcostfixing" 

$break.at.first
[1] FALSE

$break.at.value
[1] 1e+30

$epsilon
      epsb       epsd      epsel     epsint epsperturb   epspivot 
     1e-10      1e-09      1e-12      1e-07      1e-05      2e-07 

$improve
[1] "dualfeas" "thetagap"

$infinite
[1] 1e+30

$maxpivot
[1] 250

$mip.gap
absolute relative 
   1e-11    1e-11 

$negrange
[1] -1e+06

$obj.in.basis
[1] TRUE

$pivoting
[1] "devex"    "adaptive"

$presolve
[1] "none"

$scalelimit
[1] 5

$scaling
[1] "geometric"   "equilibrate" "integers"   

$sense
[1] "maximize"

$simplextype
[1] "dual"   "primal"

$timeout
[1] 0

$verbose
[1] "neutral"

set.objfn(lprec, c(275.691, 48.341))

1B) Add constrains

add.constraint(lprec, c(1, 1), "<=", 350000)
add.constraint(lprec, c(1, 0), ">=", 15000)
add.constraint(lprec, c(0, 1), ">=", 75000)
add.constraint(lprec, c(2, -1), "=", 0)

View the problem formulation in tabular/matrix form to confirm that the model was created correctly.

lprec

Model name: 
               C1       C2            
Maximize  275.691   48.341            
R1              1        1  <=  350000
R2              1        0  >=   15000
R3              0        1  >=   75000
R4              2       -1   =       0
Kind          Std      Std            
Type         Real     Real            
Upper         Inf      Inf            
Lower           0        0

1C) Solve the optimization problem

# solve 
solve(lprec)

[1] 0

Display the objective function optimum value

get.objective(lprec)

[1] 43443517

Display the variables optimum values

get.variables(lprec)

[1] 116666.7 233333.3

Task 2: Regression Analysis - Linear Regression

A linear model is of the form y = x0 + x1 + …+ x_n

2A) Read the csv file into R Studio and display the dataset.

Name your dataset ‘mydata’ so it easy to work with.
Commands: read_csv() head()

mydata <- read.csv("data/ServersCost.csv")
head(mydata)

Extract the assigned features (columns) to perform some analytics.

servers <- mydata$servers
cost <- mydata$cost

2B) Create a correlation table for your to compare the correlations between all variables. What can you tell about the correlation between the variables.

Corr <- cor(mydata)
Corr

           servers       cost
servers 1.00000000 0.03356606
cost    0.03356606 1.00000000

The correlation between these two variables is direct, positive, but very weak.

2C) Create a plot for the dependent (y) and independent (x) variables. Note any patterns or relation between the two variables describe the trend line.

The blue line here represents the linear model we created and the black dots are the data points.

Commands: p <- qplot( x = INDEPENDENT, y = DEPENDENT, data = mydata) + geom_point()

p <- qplot( x = servers, y = cost, data = mydata) +geom_point()
p

Commmand: p + geom_smooth(method = “lm”)

Add a trend line plot using the a linear model

p + geom_smooth(method = "lm")

2D) Create a linear regression model by identifying the dependent variable (y) and independent variable (x_n)

Commands: linear_model <- lm( DEPENDENT ~ INDEPENDENT )

linear_model <- lm( cost ~ servers, data =mydata ) 
predict (linear_model, data = mydata)

       1        2        3        4        5        6        7        8 
14795.19 14843.19 14891.19 14939.19 14987.19 15035.19 15083.19 15131.20 
       9       10       11       12       13       14       15       16 
15179.20 15227.20 15275.20 15323.20 15371.20 15419.21 15467.21 15515.21 
      17       18       19       20 
15563.21 15611.21 15659.21 15707.21

Use the regression model to create a report. Note the R-Squared and Adjusted R-Squared values, determine if this is a good or bad fit for your data?

Commands: summary( linear_model )

 summary( linear_model )


Call:
lm(formula = cost ~ servers, data = mydata)

Residuals:
     Min       1Q   Median       3Q      Max 
-10646.2  -8646.2   -544.7   7066.0  12858.8 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)  14747.2     4035.5   3.654  0.00181 **
servers         48.0      336.9   0.142  0.88828   
---
Signif. codes:  0 *** 0.001 ** 0.01 * 0.05 . 0.1   1

Residual standard error: 8687 on 18 degrees of freedom
Multiple R-squared:  0.001127,  Adjusted R-squared:  -0.05437 
F-statistic: 0.0203 on 1 and 18 DF,  p-value: 0.8883

R-squared is .0112 and the Adjusted R-squared is -0.05437, which indicates that this relationship is not very strong.

Task 3: Regression Analysis - Non-linear Regression

We use a transformation and use a nonlinear quadratic model to see how the model fits to the data.
A quadratic model transforms the predictor by squaring it and adding to the model.
Quadratic Model: y = x + x^2

3A) Create a non-linear quadratic regression model by identifying the dependent variable (y) and independent variables (x). Transforms the independent variable by squaring it and adding to the model.

The Quadratic model formula is: y = x + x^2
Commands: quad_model <- lm(y ~ x + x_squared)
Commands: To squared a variable use (^) such as x^2

setwd("C:\\Users\\hp\\Documents\\Spring 2018\\BSAD 343H\\Labs\\Lab 7\\07-notebook-lab")
# y = x + x^2
servers = mydata$servers
servers2 = mydata$servers^2
quad_model <- lm(cost ~ servers + servers2, data = mydata)

Use the quadratic model to create a report. Note the R-Squared and Adjusted R-Squared values, determine if this is a good or bad fit for your data?

Commands: summary( quad_model )

summary (quad_model)


Call:
lm(formula = cost ~ servers + servers2, data = mydata)

Residuals:
    Min      1Q  Median      3Q     Max 
-2897.8 -1553.4  -513.2  1152.4  4752.7 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 35417.77    1742.64   20.32 2.30e-13 ***
servers     -5589.43     382.19  -14.62 4.62e-11 ***
servers2      268.45      17.68   15.19 2.55e-11 ***
---
Signif. codes:  0 *** 0.001 ** 0.01 * 0.05 . 0.1   1

Residual standard error: 2342 on 17 degrees of freedom
Multiple R-squared:  0.9314,    Adjusted R-squared:  0.9233 
F-statistic: 115.4 on 2 and 17 DF,  p-value: 1.282e-10

3B) Compute the predicted values based on the quadratic model.

Commands: predicted_2 <- predict( quad_model, data = mydata )

servers2 = servers^2
quad_model = lm(cost ~ servers + servers2 ) 
predicted2 = predict(quad_model,data=mydata)

Create a plot using the quadratic model predicted values in color red. Noted the shape, looking at the plot is this a good or bad fit for your data?

Commands: qplot( x = DEPENDENT, y = INDEPENDENT/PREDICTED, colour = “red” )

qplot( x = servers, y = predicted2, colour = "red" )

3C) Create a non-linear cubic regression model by identifying the dependent variable (y) and independent variables (x). Transforms the independent variable by squaring it to second (x^2) and third )x^3) degrees and adding them to the model.

The Cubic model formula is: y = x + x^2 + x^3
Commands: cubic_model <- lm(y ~ x + x_squared + x_cubic)
Commands: To squared a variable use (^) such as x^2, x^3

servers <- mydata$servers
servers2 <- mydata$servers^2
servers3 <- mydata$servers^3
cubic_model <- lm(cost ~ servers + servers2 + servers3)

Use the cubic model to create a report. Note the R-Squared and Adjusted R-Squared values, determine if this is a good or bad fit for your data?

Commands: summary( cubic_model )

summary( cubic_model )


Call:
lm(formula = cost ~ servers + servers2 + servers3)

Residuals:
    Min      1Q  Median      3Q     Max 
-2871.0 -1435.1  -473.6  1271.8  4600.3 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 36133.696   2625.976  13.760 2.77e-10 ***
servers     -5954.738   1056.596  -5.636 3.72e-05 ***
servers2      310.895    115.431   2.693    0.016 *  
servers3       -1.347      3.619  -0.372    0.715    
---
Signif. codes:  0 *** 0.001 ** 0.01 * 0.05 . 0.1   1

Residual standard error: 2404 on 16 degrees of freedom
Multiple R-squared:  0.932, Adjusted R-squared:  0.9193 
F-statistic: 73.11 on 3 and 16 DF,  p-value: 1.478e-09

Multiple R-squared is .932 and adjusted R-squared is .9193, which indicates the model and variables have a strong relationship and they are a good fit for the data.

3D) Compute the predicted values based on the cubic model.

Commands: predicted3 <- predict( cubic_model, data = mydata )

predicted3 <- predict( cubic_model, data = mydata )

Create a plot using the cubic model predicted values in color green. Noted the shape, looking at the plot is this a good or bad fit for your data? Is this model better than the previous?

Commands: qplot( x = DEPENDENT, y = INDEPENDENT/PREDICTED, colour = “red” )

qplot( x = servers, y = predicted3, colour = "red" )

This model appears to have data points that are better suited to the model, because they follow a quandratic formula with little deviations. Furthermore, the values R-Squared and adjusted R-squared values are higher. ### 3E) Overlay the all models on top of the data. Which model seems to fit the best in your opinion? Justify your answer.

variables: LINEAR_MODEL , PREDICTED_QUADRATIC, PREDICTED_CUBIC

# Black = Actual Data
plot(servers, cost, pch = 16) 
# Blue = Linear Line based on Linear Regression Model
abline(linear_model,  col = "blue", lwd = 2)

# Red = Quadratic Model based on Quadratric Regression found above
# Needed to overlay new points without the labels and annotations
par(new = TRUE, xaxt = "n", yaxt = "n", ann = FALSE) 
plot(predicted2, col = "red", pch = 16)

# Green = Cubic Model based on Cubic Regression found above
# Overlay new points without the labels and annotations 
par(new = TRUE, xaxt = "n", yaxt = "n", ann = FALSE) 
plot(predicted3, col = "green", pch = 16)

Model 3 appears to be the best fit for the data, as there is little variation between the actual and plotted data.

LS0tDQp0aXRsZTogIkJ1c2luZXNzIEFuYWx5dGljcyBMYWIgV29ya3NoZWV0IDA2Ig0KYXV0aG9yOiAiQ2hleWVubmUgUGVubnkiDQpkYXRlOiAiU3ByaW5nIDIwMTgiDQpvdXRwdXQ6DQogIGh0bWxfbm90ZWJvb2s6IGRlZmF1bHQNCiAgaHRtbF9kb2N1bWVudDogZGVmYXVsdA0KICBwZGZfZG9jdW1lbnQ6IGRlZmF1bHQNCnN1YnRpdGxlOiBDTUUgR3JvdXAgRm91bmRhdGlvbiBCdXNpbmVzcyBBbmFseXRpY3MgTGFiDQotLS0NCg0KLS0tLS0tLS0tLS0tLQ0KDQojIyBOb3RlYm9vayBJbnN0cnVjdGlvbnMNCg0KLS0tLS0tLS0tLS0tLQ0KDQojIyMgQWJvdXQNCg0KKiBJbiB0aGlzIGxhYiwgd2Ugd2lsbCBmb2N1cyBvbiBsaW5lYXIgYW5kIG5vbi1saW5lYXIgcHJvZ3JhbW1pbmcuIA0KDQoqIExpbmVhciBwcm9ncmFtbWluZywgYXMgZGlzY3Vzc2VkIGluIHRoZSBwcmV2aW91cyBsYWIsIHdvcmtzIHdpdGggc2ltcGxlIGFuZCBtdWx0aXBsZSBsaW5lYXIgcmVncmVzc2lvbiB0ZWNobmlxdWVzOyBzb21ldGltZXMgdGhlIHZhcmlhYmxlcyBoYXZlIGNvbXBsZXRlbHkgZGlyZWN0IG9yIGNvbXBsZXRlbHkgbm9uLWRpcmVjdCByZWxhdGlvbnNoaXBzIGFuZCB0aGVzZSB0ZWNobmlxdWVzIGNhbiBtb2RlbCB0aGVtLg0KDQoqIFNvbWV0aW1lcywgaG93ZXZlciwgdGhlIHZhcmlhYmxlcyBkbyBub3QgcHJlZGljdCBlYWNoIG90aGVyIGluIGEgbGluZWFyIHdheS4gRm9yIGV4YW1wbGUsIGxvb2tpbmcgYXQgdGhlIHN0b2NrIG1hcmtldCB2cy4gdGltZSwgd2Uga25vdyB0aGF0IGdlbmVyYWxseSB0aGUgbWFya2V0IHdhcyBib29taW5nIGJlZm9yZSB0aGUgY3Jhc2gsIHRoZW4gdGhlIG1hcmtldCBjcmFzaGVkIGFuZCB0aGUgZ3JlYXQgZGVwcmVzc2lvbiBoaXQsIGFuZCBzbG93bHkgdGhlIG1hcmtldCBzdGFydGVkIHRvIHJpc2UgYWdhaW4uIA0KDQoqIFRoaXMgcGF0dGVybiBpcyBub3QgbGluZWFyLCBhbmQgaW4gZmFjdCBhIG5vbi1saW5lYXIgcHJvZ3JhbW1pbmcgdGVjaG5pcXVlIGNhbiBiZSB1c2VkIHRvIG1vZGVsIGl0IGFuZCBwcmVkaWN0IHRoZSB2YWx1ZSBvZiB0aGUgbWFya2V0IGJhc2VkIG9uIHRoZSB5ZWFyLiANCg0KKiBJbiB0aGlzIGxhYiwgd2Ugd2lsbCBleHBsb3JlIHRvcGljcyBsaWtlIG9wdGltaXphdGlvbiwgc29sdmUgYSBtYXJrZXRpbmcgbW9kZWwsIGFuZCBwZXJmb3JtIGxpbmVhciBhbmQgbm9uLWxpbmVhciByZWdyZXNzaW9uIG9uIHRoZSBjb3N0IG9mIHNlcnZlcnMuDQoNCg0KIyMjIExvYWQgUGFja2FnZXMgaW4gUi9SU3R1ZGlvIA0KDQpXZSBhcmUgZ29pbmcgdG8gdXNlIHRpZHl2ZXJzZSBhIGNvbGxlY3Rpb24gb2YgUiBwYWNrYWdlcyBkZXNpZ25lZCBmb3IgZGF0YSBzY2llbmNlLiANCg0KKiBJbmZvOiBodHRwczovL3d3dy50aWR5dmVyc2Uub3JnLw0KDQpgYGB7ciwgZWNobyA9IEZBTFNFfQ0KDQojIEhlcmUgd2UgYXJlIGNoZWNraW5nIGlmIHRoZSBwYWNrYWdlIGlzIGluc3RhbGxlZA0KaWYoIXJlcXVpcmUobHBTb2x2ZUFQSSkpDQogIA0KICAjIElmIHRoZSBwYWNrYWdlIGlzIG5vdCBpbiB0aGUgc3lzdGVtIHRoZW4gaXQgd2lsbCBiZSBpbnN0YWxsDQogIA0KaW5zdGFsbC5wYWNrYWdlcyhscFNvbHZlQVBJLCBkZXBlbmRlbmNpZXMgPSBUUlVFKQ0KICANCiAgIyBIZXJlIHdlIGFyZSBsb2FkaW5nIHRoZSBwYWNrYWdlDQoNCiAgbGlicmFyeShscFNvbHZlQVBJKQ0KDQpgYGANCg0KYGBge3J9DQojIEhlcmUgd2UgYXJlIGNoZWNraW5nIGlmIHRoZSBwYWNrYWdlIGlzIGluc3RhbGxlZA0KaWYoIXJlcXVpcmUoInRpZHl2ZXJzZSIpKXsNCiAgDQogICMgSWYgdGhlIHBhY2thZ2UgaXMgbm90IGluIHRoZSBzeXN0ZW0gdGhlbiBpdCB3aWxsIGJlIGluc3RhbGwNCiAgaW5zdGFsbC5wYWNrYWdlcygidGlkeXZlcnNlIiwgZGVwZW5kZW5jaWVzID0gVFJVRSkNCiAgDQogICMgSGVyZSB3ZSBhcmUgbG9hZGluZyB0aGUgcGFja2FnZQ0KICBsaWJyYXJ5KCJ0aWR5dmVyc2UiKQ0KfQ0KDQojIEhlcmUgd2UgYXJlIGNoZWNraW5nIGlmIHRoZSBwYWNrYWdlIGlzIGluc3RhbGxlZA0KaWYoIXJlcXVpcmUoInBsb3RseSIpKXsNCiAgDQogICMgSWYgdGhlIHBhY2thZ2UgaXMgbm90IGluIHRoZSBzeXN0ZW0gdGhlbiBpdCB3aWxsIGJlIGluc3RhbGwNCiAgaW5zdGFsbC5wYWNrYWdlcygicGxvdGx5IiwgZGVwZW5kZW5jaWVzID0gVFJVRSkNCiAgDQogICMgSGVyZSB3ZSBhcmUgbG9hZGluZyB0aGUgcGFja2FnZQ0KICBsaWJyYXJ5KCJwbG90bHkiKQ0KfQ0KYGBgDQoNCi0tLS0tLS0tLS0tLS0NCg0KIyMgVGFzayAxOiBMaW5lYXIgUHJvZ3JhbW1pbmcgLSBTb2x2aW5nIE1hcmtldGluZyBNb2RlbA0KDQotLS0tLS0tLS0tLS0tDQoNCiMjIyAxQSkgQ3JlYXRlIHRoZSBtb2RlbCBvYmplY3QgaW4gUi4NCg0KYGBge3J9DQoNCmxwcmVjIDwtIG1ha2UubHAoMCwgMikgDQoNCmBgYA0KDQojIyMjIFNldCB0aGUgY29uc3RyYWlucyBhbmQgb2JqZWN0aXZlIGZ1bmN0aW9uIGZvciB0aGUgbW9kZWwuDQoNCiogU2V0IGZvciBtYXhpbXVtDQpgYGB7cn0NCg0KbHAuY29udHJvbChscHJlYywgc2Vuc2U9Im1heCIpICANCnNldC5vYmpmbihscHJlYywgYygyNzUuNjkxLCA0OC4zNDEpKQ0KDQpgYGANCg0KIyMjIDFCKSBBZGQgY29uc3RyYWlucw0KDQpgYGB7cn0NCg0KYWRkLmNvbnN0cmFpbnQobHByZWMsIGMoMSwgMSksICI8PSIsIDM1MDAwMCkNCmFkZC5jb25zdHJhaW50KGxwcmVjLCBjKDEsIDApLCAiPj0iLCAxNTAwMCkNCmFkZC5jb25zdHJhaW50KGxwcmVjLCBjKDAsIDEpLCAiPj0iLCA3NTAwMCkNCmFkZC5jb25zdHJhaW50KGxwcmVjLCBjKDIsIC0xKSwgIj0iLCAwKQ0KDQpgYGANCg0KIyMjIyBWaWV3IHRoZSBwcm9ibGVtIGZvcm11bGF0aW9uIGluIHRhYnVsYXIvbWF0cml4IGZvcm0gdG8gY29uZmlybSB0aGF0IHRoZSBtb2RlbCB3YXMgY3JlYXRlZCBjb3JyZWN0bHkuDQoNCmBgYHtyfQ0KDQpscHJlYw0KDQpgYGANCg0KIyMjIDFDKSBTb2x2ZSB0aGUgb3B0aW1pemF0aW9uIHByb2JsZW0NCmBgYHtyfQ0KIyBzb2x2ZSANCnNvbHZlKGxwcmVjKSANCg0KYGBgDQoNCiMjIyMgRGlzcGxheSB0aGUgb2JqZWN0aXZlIGZ1bmN0aW9uIG9wdGltdW0gdmFsdWUNCmBgYHtyfQ0KDQpnZXQub2JqZWN0aXZlKGxwcmVjKQ0KDQpgYGANCg0KIyMjIyBEaXNwbGF5IHRoZSB2YXJpYWJsZXMgb3B0aW11bSB2YWx1ZXMNCmBgYHtyfQ0KDQpnZXQudmFyaWFibGVzKGxwcmVjKSANCg0KYGBgDQoNCi0tLS0tLS0tLS0tLS0NCg0KIyMgVGFzayAyOiBSZWdyZXNzaW9uIEFuYWx5c2lzIC0gTGluZWFyIFJlZ3Jlc3Npb24NCg0KLS0tLS0tLS0tLS0tLQ0KDQoqIEEgbGluZWFyIG1vZGVsIGlzIG9mIHRoZSBmb3JtIHkgPSB4MCArIHgxICsgLi4uKyB4X24NCg0KIyMjIDJBKSBSZWFkIHRoZSBjc3YgZmlsZSBpbnRvIFIgU3R1ZGlvIGFuZCBkaXNwbGF5IHRoZSBkYXRhc2V0LiANCg0KKiBOYW1lIHlvdXIgZGF0YXNldCAnbXlkYXRhJyBzbyBpdCBlYXN5IHRvIHdvcmsgd2l0aC4NCg0KKiBDb21tYW5kczogcmVhZF9jc3YoKSBoZWFkKCkNCg0KYGBge3J9DQoNCm15ZGF0YSA8LSByZWFkLmNzdigiZGF0YS9TZXJ2ZXJzQ29zdC5jc3YiKQ0KaGVhZChteWRhdGEpDQpgYGANCg0KIyMjIyBFeHRyYWN0IHRoZSBhc3NpZ25lZCBmZWF0dXJlcyAoY29sdW1ucykgdG8gcGVyZm9ybSBzb21lIGFuYWx5dGljcy4gDQpgYGB7cn0NCnNlcnZlcnMgPC0gbXlkYXRhJHNlcnZlcnMNCmNvc3QgPC0gbXlkYXRhJGNvc3QNCmBgYA0KDQojIyMgMkIpIENyZWF0ZSBhIGNvcnJlbGF0aW9uIHRhYmxlIGZvciB5b3VyIHRvIGNvbXBhcmUgdGhlIGNvcnJlbGF0aW9ucyBiZXR3ZWVuIGFsbCB2YXJpYWJsZXMuIFdoYXQgY2FuIHlvdSB0ZWxsIGFib3V0IHRoZSBjb3JyZWxhdGlvbiBiZXR3ZWVuIHRoZSB2YXJpYWJsZXMuICANCg0KYGBge3J9DQpDb3JyIDwtIGNvcihteWRhdGEpDQpDb3JyDQpgYGANCg0KVGhlIGNvcnJlbGF0aW9uIGJldHdlZW4gdGhlc2UgdHdvIHZhcmlhYmxlcyBpcyBkaXJlY3QsIHBvc2l0aXZlLCBidXQgdmVyeSB3ZWFrLiANCg0KDQoNCiMjIyAyQykgQ3JlYXRlIGEgcGxvdCBmb3IgdGhlIGRlcGVuZGVudCAoeSkgYW5kIGluZGVwZW5kZW50ICh4KSB2YXJpYWJsZXMuIE5vdGUgYW55IHBhdHRlcm5zIG9yIHJlbGF0aW9uIGJldHdlZW4gdGhlIHR3byB2YXJpYWJsZXMgZGVzY3JpYmUgdGhlIHRyZW5kIGxpbmUuDQoNCiogVGhlIGJsdWUgbGluZSBoZXJlIHJlcHJlc2VudHMgdGhlIGxpbmVhciBtb2RlbCB3ZSBjcmVhdGVkIGFuZCB0aGUgYmxhY2sgZG90cyBhcmUgdGhlIGRhdGEgcG9pbnRzLiANCg0KQ29tbWFuZHM6IHAgPC0gcXBsb3QoIHggPSBJTkRFUEVOREVOVCwgeSA9IERFUEVOREVOVCwgZGF0YSA9IG15ZGF0YSkgKyBnZW9tX3BvaW50KCkNCg0KYGBge3J9DQoNCnAgPC0gcXBsb3QoIHggPSBzZXJ2ZXJzLCB5ID0gY29zdCwgZGF0YSA9IG15ZGF0YSkgK2dlb21fcG9pbnQoKQ0KcA0KYGBgDQoNCkNvbW1tYW5kOiBwICsgZ2VvbV9zbW9vdGgobWV0aG9kID0gImxtIikNCg0KIyMjIyBBZGQgYSB0cmVuZCBsaW5lIHBsb3QgdXNpbmcgdGhlIGEgbGluZWFyIG1vZGVsDQpgYGB7cn0NCnAgKyBnZW9tX3Ntb290aChtZXRob2QgPSAibG0iKQ0KDQpgYGANCg0KDQojIyMgMkQpIENyZWF0ZSBhIGxpbmVhciByZWdyZXNzaW9uIG1vZGVsIGJ5IGlkZW50aWZ5aW5nIHRoZSBkZXBlbmRlbnQgdmFyaWFibGUgKHkpIGFuZCBpbmRlcGVuZGVudCB2YXJpYWJsZSAoeF9uKQ0KDQoqIENvbW1hbmRzOiBsaW5lYXJfbW9kZWwgPC0gbG0oIERFUEVOREVOVCB+IElOREVQRU5ERU5UICkgDQoNCmBgYHtyfQ0KbGluZWFyX21vZGVsIDwtIGxtKCBjb3N0IH4gc2VydmVycywgZGF0YSA9bXlkYXRhICkgDQpwcmVkaWN0IChsaW5lYXJfbW9kZWwsIGRhdGEgPSBteWRhdGEpDQpgYGANCg0KIyMjIyBVc2UgdGhlIHJlZ3Jlc3Npb24gbW9kZWwgdG8gY3JlYXRlIGEgcmVwb3J0LiBOb3RlIHRoZSBSLVNxdWFyZWQgYW5kIEFkanVzdGVkIFItU3F1YXJlZCB2YWx1ZXMsIGRldGVybWluZSBpZiB0aGlzIGlzIGEgZ29vZCBvciBiYWQgZml0IGZvciB5b3VyIGRhdGE/DQoNCiogQ29tbWFuZHM6IHN1bW1hcnkoIGxpbmVhcl9tb2RlbCApDQoNCmBgYHtyfQ0KDQogc3VtbWFyeSggbGluZWFyX21vZGVsICkNCmBgYA0KUi1zcXVhcmVkIGlzIC4wMTEyIGFuZCB0aGUgQWRqdXN0ZWQgUi1zcXVhcmVkIGlzIC0wLjA1NDM3LCB3aGljaCBpbmRpY2F0ZXMgdGhhdCB0aGlzIHJlbGF0aW9uc2hpcCBpcyBub3QgdmVyeSBzdHJvbmcuDQotLS0tLS0tLS0tLS0tDQoNCiMjIFRhc2sgMzogUmVncmVzc2lvbiBBbmFseXNpcyAtIE5vbi1saW5lYXIgUmVncmVzc2lvbg0KDQotLS0tLS0tLS0tLS0tDQoNCiogV2UgdXNlIGEgdHJhbnNmb3JtYXRpb24gYW5kIHVzZSBhIG5vbmxpbmVhciBxdWFkcmF0aWMgbW9kZWwgdG8gc2VlIGhvdyB0aGUgbW9kZWwgZml0cyB0byB0aGUgZGF0YS4NCg0KKiBBIHF1YWRyYXRpYyBtb2RlbCB0cmFuc2Zvcm1zIHRoZSBwcmVkaWN0b3IgYnkgc3F1YXJpbmcgaXQgYW5kIGFkZGluZyB0byB0aGUgbW9kZWwuIA0KKiBRdWFkcmF0aWMgTW9kZWw6IHkgPSB4ICsgeF4yDQoNCiMjIyAzQSkgQ3JlYXRlIGEgbm9uLWxpbmVhciBxdWFkcmF0aWMgcmVncmVzc2lvbiBtb2RlbCBieSBpZGVudGlmeWluZyB0aGUgZGVwZW5kZW50IHZhcmlhYmxlICh5KSBhbmQgaW5kZXBlbmRlbnQgdmFyaWFibGVzICh4KS4gVHJhbnNmb3JtcyB0aGUgaW5kZXBlbmRlbnQgdmFyaWFibGUgYnkgc3F1YXJpbmcgaXQgYW5kIGFkZGluZyB0byB0aGUgbW9kZWwuIA0KDQoqIFRoZSBRdWFkcmF0aWMgbW9kZWwgZm9ybXVsYSBpczogeSA9IHggKyB4XjINCiogQ29tbWFuZHM6IHF1YWRfbW9kZWwgPC0gbG0oeSB+IHggKyB4X3NxdWFyZWQpDQoqIENvbW1hbmRzOiBUbyBzcXVhcmVkIGEgdmFyaWFibGUgdXNlICheKSBzdWNoIGFzICB4XjINCg0KYGBge3J9DQpzZXR3ZCgiQzpcXFVzZXJzXFxocFxcRG9jdW1lbnRzXFxTcHJpbmcgMjAxOFxcQlNBRCAzNDNIXFxMYWJzXFxMYWIgN1xcMDctbm90ZWJvb2stbGFiIikNCiMgeSA9IHggKyB4XjINCnNlcnZlcnMgPSBteWRhdGEkc2VydmVycw0Kc2VydmVyczIgPSBteWRhdGEkc2VydmVyc14yDQpxdWFkX21vZGVsIDwtIGxtKGNvc3QgfiBzZXJ2ZXJzICsgc2VydmVyczIsIGRhdGEgPSBteWRhdGEpDQoNCmBgYA0KDQojIyMjIFVzZSB0aGUgcXVhZHJhdGljIG1vZGVsIHRvIGNyZWF0ZSBhIHJlcG9ydC4gTm90ZSB0aGUgUi1TcXVhcmVkIGFuZCBBZGp1c3RlZCBSLVNxdWFyZWQgdmFsdWVzLCBkZXRlcm1pbmUgaWYgdGhpcyBpcyBhIGdvb2Qgb3IgYmFkIGZpdCBmb3IgeW91ciBkYXRhPw0KDQoqIENvbW1hbmRzOiBzdW1tYXJ5KCBxdWFkX21vZGVsICkNCg0KYGBge3J9DQpzdW1tYXJ5IChxdWFkX21vZGVsKQ0KDQpgYGANCg0KDQojIyMgM0IpIENvbXB1dGUgdGhlIHByZWRpY3RlZCB2YWx1ZXMgYmFzZWQgb24gdGhlIHF1YWRyYXRpYyBtb2RlbC4NCg0KQ29tbWFuZHM6IHByZWRpY3RlZF8yIDwtIHByZWRpY3QoIHF1YWRfbW9kZWwsIGRhdGEgPSBteWRhdGEgKQ0KDQpgYGB7cn0NCnNlcnZlcnMyID0gc2VydmVyc14yDQpxdWFkX21vZGVsID0gbG0oY29zdCB+IHNlcnZlcnMgKyBzZXJ2ZXJzMiApIA0KcHJlZGljdGVkMiA9IHByZWRpY3QocXVhZF9tb2RlbCxkYXRhPW15ZGF0YSkNCg0KYGBgDQoNCiMjIyMgQ3JlYXRlIGEgcGxvdCB1c2luZyB0aGUgcXVhZHJhdGljIG1vZGVsIHByZWRpY3RlZCB2YWx1ZXMgaW4gY29sb3IgcmVkLiBOb3RlZCB0aGUgc2hhcGUsIGxvb2tpbmcgYXQgdGhlIHBsb3QgaXMgdGhpcyBhIGdvb2Qgb3IgYmFkIGZpdCBmb3IgeW91ciBkYXRhPw0KDQpDb21tYW5kczogcXBsb3QoIHggPSBERVBFTkRFTlQsIHkgPSBJTkRFUEVOREVOVC9QUkVESUNURUQsIGNvbG91ciA9ICJyZWQiICkNCg0KYGBge3J9DQoNCnFwbG90KCB4ID0gc2VydmVycywgeSA9IHByZWRpY3RlZDIsIGNvbG91ciA9ICJyZWQiICkNCg0KYGBgDQoNCg0KIyMjIDNDKSBDcmVhdGUgYSBub24tbGluZWFyIGN1YmljIHJlZ3Jlc3Npb24gbW9kZWwgYnkgaWRlbnRpZnlpbmcgdGhlIGRlcGVuZGVudCB2YXJpYWJsZSAoeSkgYW5kIGluZGVwZW5kZW50IHZhcmlhYmxlcyAoeCkuIFRyYW5zZm9ybXMgdGhlIGluZGVwZW5kZW50IHZhcmlhYmxlIGJ5IHNxdWFyaW5nIGl0IHRvIHNlY29uZCAoeF4yKSBhbmQgdGhpcmQgKXheMykgZGVncmVlcyBhbmQgYWRkaW5nIHRoZW0gdG8gdGhlIG1vZGVsLiANCg0KKiBUaGUgQ3ViaWMgbW9kZWwgZm9ybXVsYSBpczogeSA9IHggKyB4XjIgKyB4XjMNCiogQ29tbWFuZHM6IGN1YmljX21vZGVsIDwtIGxtKHkgfiB4ICsgeF9zcXVhcmVkICsgeF9jdWJpYykNCiogQ29tbWFuZHM6IFRvIHNxdWFyZWQgYSB2YXJpYWJsZSB1c2UgKF4pIHN1Y2ggYXMgIHheMiwgeF4zDQoNCmBgYHtyfQ0Kc2VydmVycyA8LSBteWRhdGEkc2VydmVycw0Kc2VydmVyczIgPC0gbXlkYXRhJHNlcnZlcnNeMg0Kc2VydmVyczMgPC0gbXlkYXRhJHNlcnZlcnNeMw0KY3ViaWNfbW9kZWwgPC0gbG0oY29zdCB+IHNlcnZlcnMgKyBzZXJ2ZXJzMiArIHNlcnZlcnMzKQ0KYGBgDQoNCiMjIyMgVXNlIHRoZSBjdWJpYyBtb2RlbCB0byBjcmVhdGUgYSByZXBvcnQuIE5vdGUgdGhlIFItU3F1YXJlZCBhbmQgQWRqdXN0ZWQgUi1TcXVhcmVkIHZhbHVlcywgZGV0ZXJtaW5lIGlmIHRoaXMgaXMgYSBnb29kIG9yIGJhZCBmaXQgZm9yIHlvdXIgZGF0YT8NCg0KKiBDb21tYW5kczogc3VtbWFyeSggY3ViaWNfbW9kZWwgKQ0KDQpgYGB7cn0NCnN1bW1hcnkoIGN1YmljX21vZGVsICkNCmBgYA0KTXVsdGlwbGUgUi1zcXVhcmVkIGlzIC45MzIgYW5kIGFkanVzdGVkIFItc3F1YXJlZCBpcyAuOTE5Mywgd2hpY2ggaW5kaWNhdGVzIHRoZSBtb2RlbCBhbmQgdmFyaWFibGVzIGhhdmUgYSBzdHJvbmcgcmVsYXRpb25zaGlwIGFuZCB0aGV5IGFyZSBhIGdvb2QgZml0IGZvciB0aGUgZGF0YS4NCg0KDQojIyMgM0QpIENvbXB1dGUgdGhlIHByZWRpY3RlZCB2YWx1ZXMgYmFzZWQgb24gdGhlIGN1YmljIG1vZGVsLg0KDQpDb21tYW5kczogcHJlZGljdGVkMyA8LSBwcmVkaWN0KCBjdWJpY19tb2RlbCwgZGF0YSA9IG15ZGF0YSApDQoNCmBgYHtyfQ0KcHJlZGljdGVkMyA8LSBwcmVkaWN0KCBjdWJpY19tb2RlbCwgZGF0YSA9IG15ZGF0YSApDQoNCmBgYA0KDQojIyMjIENyZWF0ZSBhIHBsb3QgdXNpbmcgdGhlIGN1YmljIG1vZGVsIHByZWRpY3RlZCB2YWx1ZXMgaW4gY29sb3IgZ3JlZW4uIE5vdGVkIHRoZSBzaGFwZSwgbG9va2luZyBhdCB0aGUgcGxvdCBpcyB0aGlzIGEgZ29vZCBvciBiYWQgZml0IGZvciB5b3VyIGRhdGE/IElzIHRoaXMgbW9kZWwgYmV0dGVyIHRoYW4gdGhlIHByZXZpb3VzPw0KDQpDb21tYW5kczogcXBsb3QoIHggPSBERVBFTkRFTlQsIHkgPSBJTkRFUEVOREVOVC9QUkVESUNURUQsIGNvbG91ciA9ICJyZWQiICkNCg0KYGBge3J9DQpxcGxvdCggeCA9IHNlcnZlcnMsIHkgPSBwcmVkaWN0ZWQzLCBjb2xvdXIgPSAicmVkIiApDQoNCg0KYGBgDQoNCg0KDQpUaGlzIG1vZGVsIGFwcGVhcnMgdG8gaGF2ZSBkYXRhIHBvaW50cyB0aGF0IGFyZSBiZXR0ZXIgc3VpdGVkIHRvIHRoZSBtb2RlbCwgYmVjYXVzZSB0aGV5IGZvbGxvdyBhIHF1YW5kcmF0aWMgZm9ybXVsYSB3aXRoIGxpdHRsZSBkZXZpYXRpb25zLiBGdXJ0aGVybW9yZSwgdGhlIHZhbHVlcyBSLVNxdWFyZWQgYW5kIGFkanVzdGVkIFItc3F1YXJlZCB2YWx1ZXMgYXJlIGhpZ2hlci4gDQojIyMgM0UpIE92ZXJsYXkgdGhlIGFsbCBtb2RlbHMgb24gdG9wIG9mIHRoZSBkYXRhLiBXaGljaCBtb2RlbCBzZWVtcyB0byBmaXQgdGhlIGJlc3QgaW4geW91ciBvcGluaW9uPyBKdXN0aWZ5IHlvdXIgYW5zd2VyLiANCg0KdmFyaWFibGVzOiBMSU5FQVJfTU9ERUwgLCBQUkVESUNURURfUVVBRFJBVElDLCBQUkVESUNURURfQ1VCSUMNCg0KYGBge3J9DQoNCiMgQmxhY2sgPSBBY3R1YWwgRGF0YQ0KcGxvdChzZXJ2ZXJzLCBjb3N0LCBwY2ggPSAxNikgDQojIEJsdWUgPSBMaW5lYXIgTGluZSBiYXNlZCBvbiBMaW5lYXIgUmVncmVzc2lvbiBNb2RlbA0KYWJsaW5lKGxpbmVhcl9tb2RlbCwgIGNvbCA9ICJibHVlIiwgbHdkID0gMikgIA0KDQojIFJlZCA9IFF1YWRyYXRpYyBNb2RlbCBiYXNlZCBvbiBRdWFkcmF0cmljIFJlZ3Jlc3Npb24gZm91bmQgYWJvdmUNCiMgTmVlZGVkIHRvIG92ZXJsYXkgbmV3IHBvaW50cyB3aXRob3V0IHRoZSBsYWJlbHMgYW5kIGFubm90YXRpb25zDQpwYXIobmV3ID0gVFJVRSwgeGF4dCA9ICJuIiwgeWF4dCA9ICJuIiwgYW5uID0gRkFMU0UpIA0KcGxvdChwcmVkaWN0ZWQyLCBjb2wgPSAicmVkIiwgcGNoID0gMTYpIA0KDQojIEdyZWVuID0gQ3ViaWMgTW9kZWwgYmFzZWQgb24gQ3ViaWMgUmVncmVzc2lvbiBmb3VuZCBhYm92ZQ0KIyBPdmVybGF5IG5ldyBwb2ludHMgd2l0aG91dCB0aGUgbGFiZWxzIGFuZCBhbm5vdGF0aW9ucyANCnBhcihuZXcgPSBUUlVFLCB4YXh0ID0gIm4iLCB5YXh0ID0gIm4iLCBhbm4gPSBGQUxTRSkgDQpwbG90KHByZWRpY3RlZDMsIGNvbCA9ICJncmVlbiIsIHBjaCA9IDE2KQ0KDQpgYGANCk1vZGVsIDMgYXBwZWFycyB0byBiZSB0aGUgYmVzdCBmaXQgZm9yIHRoZSBkYXRhLCBhcyB0aGVyZSBpcyBsaXR0bGUgdmFyaWF0aW9uIGJldHdlZW4gdGhlIGFjdHVhbCBhbmQgcGxvdHRlZCBkYXRhLg==

Business Analytics Lab Worksheet 06

CME Group Foundation Business Analytics Lab

Cheyenne Penny

Spring 2018

Notebook Instructions

About

Load Packages in R/RStudio

Task 1: Linear Programming - Solving Marketing Model

1A) Create the model object in R.

Set the constrains and objective function for the model.

1B) Add constrains

View the problem formulation in tabular/matrix form to confirm that the model was created correctly.

1C) Solve the optimization problem

Display the objective function optimum value

Display the variables optimum values

Task 2: Regression Analysis - Linear Regression

2A) Read the csv file into R Studio and display the dataset.

Extract the assigned features (columns) to perform some analytics.

2B) Create a correlation table for your to compare the correlations between all variables. What can you tell about the correlation between the variables.

2C) Create a plot for the dependent (y) and independent (x) variables. Note any patterns or relation between the two variables describe the trend line.

Add a trend line plot using the a linear model

2D) Create a linear regression model by identifying the dependent variable (y) and independent variable (x_n)

Use the regression model to create a report. Note the R-Squared and Adjusted R-Squared values, determine if this is a good or bad fit for your data?

R-squared is .0112 and the Adjusted R-squared is -0.05437, which indicates that this relationship is not very strong.

Task 3: Regression Analysis - Non-linear Regression

3A) Create a non-linear quadratic regression model by identifying the dependent variable (y) and independent variables (x). Transforms the independent variable by squaring it and adding to the model.

Use the quadratic model to create a report. Note the R-Squared and Adjusted R-Squared values, determine if this is a good or bad fit for your data?

3B) Compute the predicted values based on the quadratic model.

Create a plot using the quadratic model predicted values in color red. Noted the shape, looking at the plot is this a good or bad fit for your data?

3C) Create a non-linear cubic regression model by identifying the dependent variable (y) and independent variables (x). Transforms the independent variable by squaring it to second (x^2) and third )x^3) degrees and adding them to the model.

Use the cubic model to create a report. Note the R-Squared and Adjusted R-Squared values, determine if this is a good or bad fit for your data?

3D) Compute the predicted values based on the cubic model.

Create a plot using the cubic model predicted values in color green. Noted the shape, looking at the plot is this a good or bad fit for your data? Is this model better than the previous?