Lesson 2.3 - The Bias Variance Trade-Off

Bias-Variance Trade-Off

Bias-Variance Trade-Off

Assume that we are considering a variety of training methods for a regression problem, and that the methods can be ordered in terms of their flexibility. As we saw in the last lesson, the training MSE score will typically decrease as the flexibility increases. The validation MSE, on the other hand, with usually display a U-shape relationship when plotted against flexibility. In this section, we will come to understand this aspect of the validation MSE by studying two related values: Bias and Variance.

Setting

Assume the following:

We have access to a known population model, \(Y = f(X) + \varepsilon\), where \(\varepsilon \sim N(0, \sigma^2)\).
The following values of the predictor \(X\) have been set: \(x_0, x_1, x_2, ..., x_n\)
A specific regression method has been supplied to us.

Suppose that we wish to study the performance of the supplied regression method on samples generated from this population model. We might carry out our study by performing the following steps many times:

We will collect a sample of \(n+1\) observations \((x_i, y_i)\) for \(i = 0, 1, 2, ... n\).
We will designate the observations \((x_i, y_i)\) for \(i = 1, 2, ... n\) as our training set, and will use the single observation \((x_0, y_0)\) for validation.
Applying the selected regression method to the training set, we generate a fitted model \(\hat y = \hat f (x)\).
We will plug the pre-selected value \(X = x_0\) into our model to generate a prediction \(\hat y_0 = \hat f (x_0)\).

Because of the random variable \(\varepsilon\) in our population models, the \(y_i\) values will vary from one sample to the next. As a result, the fitted model generated in Step 3 will vary from one iteration to the next, even though we are applying the same fitted method each time. Since the fitted function \(f\) changes with each iteration, so too does the fitted value \(\hat y_0\). In this sense, the value of \(\hat y_0\) represents a single observation of a random variable, which we will denote by \(\hat Y_0\).

Since \(\hat Y_0\) is a random variable, we can (in theory) calculate \(\mathrm E \left[\hat Y_0 \right]\) and \(\mathrm {Var}\left[\hat Y_0 \right]\).

Bias

We will define the bias of our fitted value \(\hat Y_0\) as follows:

\[\mathrm{Bias} \left[\hat Y_0 \right] = \mathrm E \left[\hat Y_0 \right] - f(x_0)\]

Note that since \(\mathrm E \left[\varepsilon \right] = 0\), the expected value of \(Y\) given \(X=x_0\) is given by \(\mathrm E \left[Y \mid X=x_0 \right] = f(x_0)\). With this in mind, we can interpret \(\mathrm{Bias}\) as the amount that you would expect the prediction \(\hat Y_0\) to exceed the observed value of \(Y_0\) (on average). Regression methods that have a positive bias at \(X=x_0\) will tend to generate over-predictions for \(Y_0\), while methods with a negative will tend to generate under-predictions.

Decomposing Validation MSE

Since we are using a single observation \((x_0, Y_0)\) for our validation set, the validation MSE is given by:

\[MSE = \left(Y_0 - \hat Y_0 \right)^2\] Since \(Y_0\) and \(\hat Y_0\) are both random variables, \(MSE\) is also a random variable whose value depends on the sample drawn (and the fitted model resulting from that sample). It can be shown that the expected value of \(MSE\) can be decomposed in the following way:

\[\mathrm E \left[ MSE \right] = \mathrm{Var}\left[\hat Y_0 \right] + \left(\mathrm{Bias}\left[\hat Y_0 \right] \right)^2 + \mathrm{Var}\left(\varepsilon\right)\]

Note that all of the values in the decomposition of \(\mathrm E \left[ MSE \right]\) are positive, and that \(\mathrm{Var}\left(\varepsilon\right) = \sigma^2\) is a constant that comes from the population model, and is unaffected by our choice of regression method.

Minimizing E[MSE] (The Trade-Off)

Assume know that we have at our disposal several regression methods, with varying levels of flexibility. Our goal is to select a method that will minimize \(\mathrm E \left[ MSE \right]\). Since we have no control over \(\mathrm{Var}\left(\varepsilon\right)\), our goal amounts to trying to minimize the following two quantities:

The Squared Bias, \(\left(\mathrm{Bias}\left[\hat Y_0 \right] \right)^2\)
The Variance, \(\mathrm{Var}\left[\hat Y_0 \right]\)

Unfortunately, it tends to be the case that regression methods which produce models with very low values for one of these metrics will also produce very large values for the other metric. More specifically:

Very flexible models tend to have low bias, but high variance.
Very rigid models tend to have high bias, but low variance.

Our goal in selecting a regression method is to determine an appropriate level of flexibility in order to obtain a model with moderately low values of both squared bias and variance. This is referred to as the bias-variance trade-off.

Plotting Bias, Variance, and MSE

The following plots display typical ways in which bias, variance, and MSE depend on model flexibility.

Final Observations

It should be pointed out that it is impossible to calculate either bias or variance without having access to the population model. As a result, it is not feasible to calculate these values in practice. However, the way in which these quantities depend on the flexibility of our fitting method, and the way in which these values affect the value of MSE are import principles to keep in mind.

LS0tDQp0aXRsZTogIkxlc3NvbiAyLjMgLSBUaGUgQmlhcyBWYXJpYW5jZSBUcmFkZS1PZmYiDQphdXRob3I6ICJSb2JiaWUgQmVhbmUiDQpvdXRwdXQ6DQogIGh0bWxfbm90ZWJvb2s6DQogICAgdGhlbWU6IGZsYXRseQ0KICAgIHRvYzogdHJ1ZQ0KICAgIHRvY19kZXB0aDogNA0KLS0tDQoNCiMjIyAqKkJpYXMtVmFyaWFuY2UgVHJhZGUtT2ZmKioNCg0KQXNzdW1lIHRoYXQgd2UgYXJlIGNvbnNpZGVyaW5nIGEgdmFyaWV0eSBvZiB0cmFpbmluZyBtZXRob2RzIGZvciBhIHJlZ3Jlc3Npb24gcHJvYmxlbSwgYW5kIHRoYXQgdGhlIG1ldGhvZHMgY2FuIGJlIG9yZGVyZWQgaW4gdGVybXMgb2YgdGhlaXIgZmxleGliaWxpdHkuIEFzIHdlIHNhdyBpbiB0aGUgbGFzdCBsZXNzb24sIHRoZSB0cmFpbmluZyBNU0Ugc2NvcmUgd2lsbCB0eXBpY2FsbHkgZGVjcmVhc2UgYXMgdGhlIGZsZXhpYmlsaXR5IGluY3JlYXNlcy4gVGhlIHZhbGlkYXRpb24gTVNFLCBvbiB0aGUgb3RoZXIgaGFuZCwgd2l0aCB1c3VhbGx5IGRpc3BsYXkgYSBVLXNoYXBlIHJlbGF0aW9uc2hpcCB3aGVuIHBsb3R0ZWQgYWdhaW5zdCBmbGV4aWJpbGl0eS4gSW4gdGhpcyBzZWN0aW9uLCB3ZSB3aWxsIGNvbWUgdG8gdW5kZXJzdGFuZCB0aGlzIGFzcGVjdCBvZiB0aGUgdmFsaWRhdGlvbiBNU0UgYnkgc3R1ZHlpbmcgdHdvIHJlbGF0ZWQgdmFsdWVzOiBCaWFzIGFuZCBWYXJpYW5jZS4gDQoNCiMjIyMgKipTZXR0aW5nKioNCg0KQXNzdW1lIHRoZSBmb2xsb3dpbmc6DQoNCg0KKiBXZSBoYXZlIGFjY2VzcyB0byBhIGtub3duIHBvcHVsYXRpb24gbW9kZWwsICRZID0gZihYKSArIFx2YXJlcHNpbG9uJCwgd2hlcmUgJFx2YXJlcHNpbG9uIFxzaW0gTigwLCBcc2lnbWFeMikkLiANCg0KKiBUaGUgZm9sbG93aW5nIHZhbHVlcyBvZiB0aGUgcHJlZGljdG9yICRYJCBoYXZlIGJlZW4gc2V0OiAkeF8wLCB4XzEsIHhfMiwgLi4uLCB4X24kIA0KDQoqIEEgc3BlY2lmaWMgcmVncmVzc2lvbiBtZXRob2QgaGFzIGJlZW4gc3VwcGxpZWQgdG8gdXMuIA0KDQoNClN1cHBvc2UgdGhhdCB3ZSB3aXNoIHRvIHN0dWR5IHRoZSBwZXJmb3JtYW5jZSBvZiB0aGUgc3VwcGxpZWQgcmVncmVzc2lvbiBtZXRob2Qgb24gc2FtcGxlcyBnZW5lcmF0ZWQgZnJvbSB0aGlzIHBvcHVsYXRpb24gbW9kZWwuIFdlIG1pZ2h0IGNhcnJ5IG91dCBvdXIgc3R1ZHkgYnkgcGVyZm9ybWluZyB0aGUgZm9sbG93aW5nIHN0ZXBzIG1hbnkgdGltZXM6DQoNCjEuIFdlIHdpbGwgY29sbGVjdCBhIHNhbXBsZSBvZiAkbisxJCBvYnNlcnZhdGlvbnMgJCh4X2ksIHlfaSkkIGZvciAkaSA9IDAsIDEsIDIsIC4uLiBuJC4gDQoNCjIuIFdlIHdpbGwgZGVzaWduYXRlIHRoZSBvYnNlcnZhdGlvbnMgJCh4X2ksIHlfaSkkIGZvciAkaSA9IDEsIDIsIC4uLiBuJCBhcyBvdXIgdHJhaW5pbmcgc2V0LCBhbmQgd2lsbCB1c2UgdGhlIHNpbmdsZSBvYnNlcnZhdGlvbiAkKHhfMCwgeV8wKSQgZm9yIHZhbGlkYXRpb24uIA0KDQozLiBBcHBseWluZyB0aGUgIHNlbGVjdGVkIHJlZ3Jlc3Npb24gbWV0aG9kIHRvIHRoZSB0cmFpbmluZyBzZXQsIHdlIGdlbmVyYXRlIGEgZml0dGVkIG1vZGVsICRcaGF0IHkgPSBcaGF0IGYgKHgpJC4gDQoNCjQuIFdlIHdpbGwgcGx1ZyB0aGUgcHJlLXNlbGVjdGVkIHZhbHVlICRYID0geF8wJCBpbnRvIG91ciBtb2RlbCB0byBnZW5lcmF0ZSBhIHByZWRpY3Rpb24gJFxoYXQgeV8wID0gXGhhdCBmICh4XzApJC4NCg0KQmVjYXVzZSBvZiB0aGUgcmFuZG9tIHZhcmlhYmxlICRcdmFyZXBzaWxvbiQgaW4gb3VyIHBvcHVsYXRpb24gbW9kZWxzLCB0aGUgJHlfaSQgdmFsdWVzIHdpbGwgdmFyeSBmcm9tIG9uZSBzYW1wbGUgdG8gdGhlIG5leHQuIEFzIGEgcmVzdWx0LCB0aGUgZml0dGVkIG1vZGVsIGdlbmVyYXRlZCBpbiBTdGVwIDMgd2lsbCB2YXJ5IGZyb20gb25lIGl0ZXJhdGlvbiB0byB0aGUgbmV4dCwgZXZlbiB0aG91Z2ggd2UgYXJlIGFwcGx5aW5nIHRoZSBzYW1lIGZpdHRlZCBtZXRob2QgZWFjaCB0aW1lLiBTaW5jZSB0aGUgZml0dGVkIGZ1bmN0aW9uICRmJCBjaGFuZ2VzIHdpdGggZWFjaCBpdGVyYXRpb24sIHNvIHRvbyBkb2VzIHRoZSBmaXR0ZWQgdmFsdWUgJFxoYXQgeV8wJC4gSW4gdGhpcyBzZW5zZSwgdGhlIHZhbHVlIG9mICRcaGF0IHlfMCQgcmVwcmVzZW50cyBhIHNpbmdsZSBvYnNlcnZhdGlvbiBvZiBhIHJhbmRvbSB2YXJpYWJsZSwgd2hpY2ggd2Ugd2lsbCBkZW5vdGUgYnkgJFxoYXQgWV8wJC4gDQoNClNpbmNlICRcaGF0IFlfMCQgaXMgYSByYW5kb20gdmFyaWFibGUsIHdlIGNhbiAoaW4gdGhlb3J5KSBjYWxjdWxhdGUgJFxtYXRocm0gRSBcbGVmdFtcaGF0IFlfMCBccmlnaHRdJCBhbmQgJFxtYXRocm0ge1Zhcn1cbGVmdFtcaGF0IFlfMCBccmlnaHRdJC4gDQoNCiMjIyMgKipCaWFzKioNCg0KV2Ugd2lsbCBkZWZpbmUgdGhlICoqYmlhcyoqIG9mIG91ciBmaXR0ZWQgdmFsdWUgJFxoYXQgWV8wJCBhcyBmb2xsb3dzOg0KDQokJFxtYXRocm17Qmlhc30gXGxlZnRbXGhhdCBZXzAgXHJpZ2h0XSA9IFxtYXRocm0gRSBcbGVmdFtcaGF0IFlfMCBccmlnaHRdIC0gZih4XzApJCQNCg0KTm90ZSB0aGF0IHNpbmNlICRcbWF0aHJtIEUgXGxlZnRbXHZhcmVwc2lsb24gXHJpZ2h0XSA9IDAkLCB0aGUgZXhwZWN0ZWQgdmFsdWUgb2YgJFkkIGdpdmVuICRYPXhfMCQgaXMgZ2l2ZW4gYnkgICRcbWF0aHJtIEUgXGxlZnRbWSBcbWlkIFg9eF8wIFxyaWdodF0gPSBmKHhfMCkkLiBXaXRoIHRoaXMgaW4gbWluZCwgd2UgY2FuIGludGVycHJldCAkXG1hdGhybXtCaWFzfSQgYXMgdGhlIGFtb3VudCB0aGF0IHlvdSB3b3VsZCBleHBlY3QgdGhlIHByZWRpY3Rpb24gJFxoYXQgWV8wJCB0byBleGNlZWQgdGhlIG9ic2VydmVkIHZhbHVlIG9mICRZXzAkIChvbiBhdmVyYWdlKS4gUmVncmVzc2lvbiBtZXRob2RzIHRoYXQgaGF2ZSBhIHBvc2l0aXZlIGJpYXMgYXQgJFg9eF8wJCB3aWxsIHRlbmQgdG8gZ2VuZXJhdGUgb3Zlci1wcmVkaWN0aW9ucyBmb3IgJFlfMCQsIHdoaWxlIG1ldGhvZHMgd2l0aCBhIG5lZ2F0aXZlIHdpbGwgdGVuZCB0byBnZW5lcmF0ZSB1bmRlci1wcmVkaWN0aW9ucy4gDQoNCg0KIyMjIyAqKkRlY29tcG9zaW5nIFZhbGlkYXRpb24gTVNFKioNCg0KU2luY2Ugd2UgYXJlIHVzaW5nIGEgc2luZ2xlIG9ic2VydmF0aW9uICQoeF8wLCBZXzApJCBmb3Igb3VyIHZhbGlkYXRpb24gc2V0LCB0aGUgdmFsaWRhdGlvbiBNU0UgaXMgZ2l2ZW4gYnk6DQoNCiQkTVNFID0gXGxlZnQoWV8wIC0gXGhhdCBZXzAgXHJpZ2h0KV4yJCQNClNpbmNlICRZXzAkIGFuZCAkXGhhdCBZXzAkIGFyZSBib3RoIHJhbmRvbSB2YXJpYWJsZXMsICRNU0UkIGlzIGFsc28gYSByYW5kb20gdmFyaWFibGUgd2hvc2UgdmFsdWUgZGVwZW5kcyBvbiB0aGUgc2FtcGxlIGRyYXduIChhbmQgdGhlIGZpdHRlZCBtb2RlbCByZXN1bHRpbmcgZnJvbSB0aGF0IHNhbXBsZSkuIEl0IGNhbiBiZSBzaG93biB0aGF0IHRoZSBleHBlY3RlZCB2YWx1ZSBvZiAkTVNFJCBjYW4gYmUgZGVjb21wb3NlZCBpbiB0aGUgZm9sbG93aW5nIHdheToNCg0KJCRcbWF0aHJtIEUgXGxlZnRbIE1TRSBccmlnaHRdID0gXG1hdGhybXtWYXJ9XGxlZnRbXGhhdCBZXzAgXHJpZ2h0XSArIFxsZWZ0KFxtYXRocm17Qmlhc31cbGVmdFtcaGF0IFlfMCBccmlnaHRdIFxyaWdodCleMiArIFxtYXRocm17VmFyfVxsZWZ0KFx2YXJlcHNpbG9uXHJpZ2h0KSQkDQoNCk5vdGUgdGhhdCBhbGwgb2YgdGhlIHZhbHVlcyBpbiB0aGUgZGVjb21wb3NpdGlvbiBvZiAkXG1hdGhybSBFIFxsZWZ0WyBNU0UgXHJpZ2h0XSQgYXJlIHBvc2l0aXZlLCBhbmQgdGhhdCAkXG1hdGhybXtWYXJ9XGxlZnQoXHZhcmVwc2lsb25ccmlnaHQpID0gXHNpZ21hXjIkIGlzIGEgY29uc3RhbnQgdGhhdCBjb21lcyBmcm9tIHRoZSBwb3B1bGF0aW9uIG1vZGVsLCBhbmQgaXMgdW5hZmZlY3RlZCBieSBvdXIgY2hvaWNlIG9mIHJlZ3Jlc3Npb24gbWV0aG9kLiANCg0KIyMjIyAqKk1pbmltaXppbmcgRVtNU0VdIChUaGUgVHJhZGUtT2ZmKSoqDQoNCkFzc3VtZSBrbm93IHRoYXQgd2UgaGF2ZSBhdCBvdXIgZGlzcG9zYWwgc2V2ZXJhbCByZWdyZXNzaW9uIG1ldGhvZHMsIHdpdGggdmFyeWluZyBsZXZlbHMgb2YgZmxleGliaWxpdHkuIE91ciBnb2FsIGlzIHRvIHNlbGVjdCBhIG1ldGhvZCB0aGF0IHdpbGwgbWluaW1pemUgJFxtYXRocm0gRSBcbGVmdFsgTVNFIFxyaWdodF0kLiBTaW5jZSB3ZSBoYXZlIG5vIGNvbnRyb2wgb3ZlciAkXG1hdGhybXtWYXJ9XGxlZnQoXHZhcmVwc2lsb25ccmlnaHQpJCwgb3VyIGdvYWwgYW1vdW50cyB0byB0cnlpbmcgdG8gbWluaW1pemUgdGhlIGZvbGxvd2luZyB0d28gcXVhbnRpdGllczoNCg0KKiBUaGUgKipTcXVhcmVkIEJpYXMqKiwgJFxsZWZ0KFxtYXRocm17Qmlhc31cbGVmdFtcaGF0IFlfMCBccmlnaHRdIFxyaWdodCleMiQNCiogVGhlICoqVmFyaWFuY2UqKiwgJFxtYXRocm17VmFyfVxsZWZ0W1xoYXQgWV8wIFxyaWdodF0kDQoNClVuZm9ydHVuYXRlbHksIGl0IHRlbmRzIHRvIGJlIHRoZSBjYXNlIHRoYXQgcmVncmVzc2lvbiBtZXRob2RzIHdoaWNoIHByb2R1Y2UgbW9kZWxzIHdpdGggdmVyeSBsb3cgdmFsdWVzIGZvciBvbmUgb2YgdGhlc2UgbWV0cmljcyB3aWxsIGFsc28gcHJvZHVjZSB2ZXJ5IGxhcmdlIHZhbHVlcyBmb3IgdGhlIG90aGVyIG1ldHJpYy4gTW9yZSBzcGVjaWZpY2FsbHk6DQoNCiogVmVyeSBmbGV4aWJsZSBtb2RlbHMgdGVuZCB0byBoYXZlIGxvdyBiaWFzLCBidXQgaGlnaCB2YXJpYW5jZS4gDQoqIFZlcnkgcmlnaWQgbW9kZWxzIHRlbmQgdG8gaGF2ZSBoaWdoIGJpYXMsIGJ1dCBsb3cgdmFyaWFuY2UuIA0KDQpPdXIgZ29hbCBpbiBzZWxlY3RpbmcgYSByZWdyZXNzaW9uIG1ldGhvZCBpcyB0byBkZXRlcm1pbmUgYW4gYXBwcm9wcmlhdGUgbGV2ZWwgb2YgZmxleGliaWxpdHkgaW4gb3JkZXIgdG8gb2J0YWluIGEgbW9kZWwgd2l0aCBtb2RlcmF0ZWx5IGxvdyB2YWx1ZXMgb2YgYm90aCBzcXVhcmVkIGJpYXMgYW5kIHZhcmlhbmNlLiBUaGlzIGlzIHJlZmVycmVkIHRvIGFzIHRoZSAqKmJpYXMtdmFyaWFuY2UgdHJhZGUtb2ZmKiouDQoNCiMjIyMgKipQbG90dGluZyBCaWFzLCBWYXJpYW5jZSwgYW5kIE1TRSoqDQoNClRoZSBmb2xsb3dpbmcgcGxvdHMgZGlzcGxheSB0eXBpY2FsIHdheXMgaW4gd2hpY2ggYmlhcywgdmFyaWFuY2UsIGFuZCBNU0UgZGVwZW5kIG9uIG1vZGVsIGZsZXhpYmlsaXR5LiANCg0KIVtdKGltYWdlcy9CVlRPLlBORykNCg0KIyMjIyAqKkZpbmFsIE9ic2VydmF0aW9ucyoqDQoNCkl0IHNob3VsZCBiZSBwb2ludGVkIG91dCB0aGF0IGl0IGlzIGltcG9zc2libGUgdG8gY2FsY3VsYXRlIGVpdGhlciBiaWFzIG9yIHZhcmlhbmNlIHdpdGhvdXQgaGF2aW5nIGFjY2VzcyB0byB0aGUgcG9wdWxhdGlvbiBtb2RlbC4gQXMgYSByZXN1bHQsIGl0IGlzIG5vdCBmZWFzaWJsZSB0byBjYWxjdWxhdGUgdGhlc2UgdmFsdWVzIGluIHByYWN0aWNlLiBIb3dldmVyLCB0aGUgd2F5IGluIHdoaWNoIHRoZXNlIHF1YW50aXRpZXMgZGVwZW5kIG9uIHRoZSBmbGV4aWJpbGl0eSBvZiBvdXIgZml0dGluZyBtZXRob2QsIGFuZCB0aGUgd2F5IGluIHdoaWNoIHRoZXNlIHZhbHVlcyBhZmZlY3QgdGhlIHZhbHVlIG9mIE1TRSBhcmUgaW1wb3J0IHByaW5jaXBsZXMgdG8ga2VlcCBpbiBtaW5kLiANCg==