AS6-3 Group4 預測股票的投資報酬

主要議題：預測股票的投資報酬

學習重點：

先分群以後、再做預測性模型
集群分析的模型與預測方法

rm(list=ls(all=T))
Sys.setlocale("LC_ALL","C")

[1] "C"

options(digits=6, scipen=12)
library(dplyr)
library(caTools)
library(caret)
library(flexclust)

1. 資料探索

1.1

Load StocksCluster.csv into a data frame called “stocks”.

stocks = read.csv("data/StocksCluster.csv")
nrow(stocks)

[1] 11580

How many observations are in the dataset?

11580

1.2

sum(stocks$PositiveDec==1) / nrow(stocks)

[1] 0.546114

What proportion of the observations have positive returns in December?

0.546114

1.3

names(stocks)

 [1] "ReturnJan"   "ReturnFeb"   "ReturnMar"   "ReturnApr"   "ReturnMay"   "ReturnJune" 
 [7] "ReturnJuly"  "ReturnAug"   "ReturnSep"   "ReturnOct"   "ReturnNov"   "PositiveDec"

cor(stocks[,1:11]) %>% sort

  [1] -0.191351924 -0.191351924 -0.155983263 -0.155983263 -0.154658281 -0.154658281 -0.116489034
  [8] -0.116489034 -0.095520920 -0.095520920 -0.090496798 -0.090496798 -0.087324267 -0.087324267
 [15] -0.085905486 -0.085905486 -0.081429765 -0.081429765 -0.075594561 -0.075594561 -0.065270541
 [22] -0.065270541 -0.061778509 -0.061778509 -0.058079236 -0.058079236 -0.054708909 -0.054708909
 [29] -0.051756051 -0.051756051 -0.048373837 -0.048373837 -0.044411417 -0.044411417 -0.037678006
 [36] -0.037678006 -0.033125658 -0.033125658 -0.029152600 -0.029152600 -0.028920972 -0.028920972
 [43] -0.026437153 -0.026437153 -0.022792019 -0.022792019 -0.022635994 -0.022635994 -0.022005400
 [50] -0.022005400 -0.021074539 -0.021074539 -0.019719800 -0.019719800 -0.011923758 -0.011923758
 [57] -0.011027752 -0.011027752 -0.003892789 -0.003892789  0.000713756  0.000713756  0.000740714
 [64]  0.000740714  0.003374160  0.003374160  0.009726288  0.009726288  0.010710526  0.010710526
 [71]  0.017166728  0.017166728  0.021962862  0.021962862  0.031761837  0.031761837  0.037323535
 [78]  0.037323535  0.043501771  0.043501771  0.044747269  0.044747269  0.048046590  0.048046590
 [85]  0.048540025  0.048540025  0.063822504  0.063822504  0.066774583  0.066774583  0.067632333
 [92]  0.067632333  0.068947804  0.068947804  0.076518327  0.076518327  0.080631932  0.080631932
 [99]  0.090850264  0.090850264  0.092238307  0.092238307  0.131559786  0.131559786  0.142977229
[106]  0.142977229  0.169994483  0.169994483  0.191672786  0.191672786  1.000000000  1.000000000
[113]  1.000000000  1.000000000  1.000000000  1.000000000  1.000000000  1.000000000  1.000000000
[120]  1.000000000  1.000000000

#  0.191672786 
cor(stocks[,1:11])

            ReturnJan  ReturnFeb   ReturnMar   ReturnApr   ReturnMay ReturnJune   ReturnJuly
ReturnJan   1.0000000  0.0667746 -0.09049680 -0.03767801 -0.04441142  0.0922383 -0.081429765
ReturnFeb   0.0667746  1.0000000 -0.15598326 -0.19135192 -0.09552092  0.1699945 -0.061778509
ReturnMar  -0.0904968 -0.1559833  1.00000000  0.00972629 -0.00389279 -0.0859055  0.003374160
ReturnApr  -0.0376780 -0.1913519  0.00972629  1.00000000  0.06382250 -0.0110278  0.080631932
ReturnMay  -0.0444114 -0.0955209 -0.00389279  0.06382250  1.00000000 -0.0210745  0.090850264
ReturnJune  0.0922383  0.1699945 -0.08590549 -0.01102775 -0.02107454  1.0000000 -0.029152600
ReturnJuly -0.0814298 -0.0617785  0.00337416  0.08063193  0.09085026 -0.0291526  1.000000000
ReturnAug  -0.0227920  0.1315598 -0.02200540 -0.05175605 -0.03312566  0.0107105  0.000713756
ReturnSep  -0.0264372  0.0435018  0.07651833 -0.02892097  0.02196286  0.0447473  0.068947804
ReturnOct   0.1429772 -0.0873243 -0.01192376  0.04854003  0.01716673 -0.0226360 -0.054708909
ReturnNov   0.0676323 -0.1546583  0.03732353  0.03176184  0.04804659 -0.0652705 -0.048373837
              ReturnAug    ReturnSep  ReturnOct  ReturnNov
ReturnJan  -0.022792019 -0.026437153  0.1429772  0.0676323
ReturnFeb   0.131559786  0.043501771 -0.0873243 -0.1546583
ReturnMar  -0.022005400  0.076518327 -0.0119238  0.0373235
ReturnApr  -0.051756051 -0.028920972  0.0485400  0.0317618
ReturnMay  -0.033125658  0.021962862  0.0171667  0.0480466
ReturnJune  0.010710526  0.044747269 -0.0226360 -0.0652705
ReturnJuly  0.000713756  0.068947804 -0.0547089 -0.0483738
ReturnAug   1.000000000  0.000740714 -0.0755946 -0.1164890
ReturnSep   0.000740714  1.000000000 -0.0580792 -0.0197198
ReturnOct  -0.075594561 -0.058079236  1.0000000  0.1916728
ReturnNov  -0.116489034 -0.019719800  0.1916728  1.0000000

What is the maximum correlation between any two return variables in the dataset? You should look at the pairwise correlations between ReturnJan, ReturnFeb, ReturnMar, ReturnApr, ReturnMay, ReturnJune, ReturnJuly, ReturnAug, ReturnSep, ReturnOct, and ReturnNov.

between ReturnOct and ReturnNov.

1.4

colMeans(stocks[,1:11])  %>% sort()

  ReturnSep   ReturnFeb  ReturnJuly   ReturnOct  ReturnJune   ReturnNov   ReturnJan   ReturnAug 
-0.01472077 -0.00760478  0.00305086  0.00565084  0.00593790  0.01138744  0.01263160  0.01619826 
  ReturnMar   ReturnMay   ReturnApr 
 0.01940234  0.02473659  0.02630815

Which month (from January through November) has the largest mean return across all observations in the dataset?

April

Which month (from January through November) has the smallest mean return across all observations in the dataset?

September

2. 邏輯式回歸，單一模型

分割訓練、測試資料

Run the following commands to split the data into a training set and testing set, putting 70% of the data in the training set and 30% of the data in the testing set:

set.seed(144)

spl = sample.split(stocks$PositiveDec, SplitRatio = 0.7)

stocksTrain = subset(stocks, spl == TRUE)

stocksTest = subset(stocks, spl == FALSE)

set.seed(144)
spl = sample.split(stocks$PositiveDec, SplitRatio = 0.7)
stocksTrain = subset(stocks, spl == TRUE)
stocksTest = subset(stocks, spl == FALSE)
StocksModel = glm(PositiveDec ~.,data=stocksTrain, family=binomial)

2.1 單一模型：訓練準確率，$\text{acc}_{train}$

Then, use the stocksTrain data frame to train a logistic regression model (name it StocksModel) to predict PositiveDec using all the other variables as independent variables. Don’t forget to add the argument family=binomial to your glm command.

PredictTrain = predict(StocksModel, type="response")
A = table(stocksTrain$PositiveDec, PredictTrain > 0.5)
sum(diag(A))/sum(A)

[1] 0.571182

What is the overall accuracy on the training set, using a threshold of 0.5?

0.571182

2.2 單一模型：測試準確率，$\text{acc}_{test}$

PredictTest = predict(StocksModel, newdata=stocksTest ,type="response")
B = table(stocksTest$PositiveDec, PredictTest > 0.5)
sum(diag(B))/sum(B)

[1] 0.56707

Now obtain test set predictions from StocksModel. What is the overall accuracy of the model on the test, again using a threshold of 0.5?

0.56707

2.3 單一模型：底線準確率，$\text{acc}_{baseline}$

table(stocksTest$PositiveDec)


   0    1 
1577 1897

C = table(stocksTest$PositiveDec, stocksTest$PositiveDec==1)
1897/nrow(stocksTest)

[1] 0.546056

What is the accuracy on the test set of a baseline model that always predicts the most common outcome (PositiveDec = 1)?

0.546056

3. 集群分析

3.1 移除目標變數

Now, let’s cluster the stocks. The first step in this process is to remove the dependent variable using the following commands:

limitedTrain = stocksTrain
limitedTrain$PositiveDec = NULL
limitedTest = stocksTest
limitedTest$PositiveDec = NULL

Why do we need to remove the dependent variable in the clustering phase of the cluster-then-predict methodology?

Needing to know the dependent variable value to assign an observation to a cluster defeats the purpose of the methodology

3.2 區隔變數常態化

In the market segmentation assignment in this week’s homework, you were introduced to the preProcess command from the caret package, which normalizes variables by subtracting by the mean and dividing by the standard deviation.

In cases where we have a training and testing set, we’ll want to normalize by the mean and standard deviation of the variables in the training set. We can do this by passing just the training set to the preProcess function:

library(caret)
preproc = preProcess(limitedTrain)
normTrain = predict(preproc, limitedTrain)
normTest = predict(preproc, limitedTest)

mean(normTrain$ReturnJan)

[1] 2.10059e-17

What is the mean of the ReturnJan variable in normTrain?

2.10059e-17

mean(normTest$ReturnJan)

[1] -0.000418589

What is the mean of the ReturnJan variable in normTest?

-0.000418589

3.3 測試資料的常態化結果

Why is the mean ReturnJan variable much closer to 0 in normTrain than in normTest?

The distribution of the ReturnJan variable is different in the training and testing set

3.4 K-Means集群

Set the random seed to 144 (it is important to do this again, even though we did it earlier). Run k-means clustering with 3 clusters on normTrain, storing the result in an object called km.

set.seed(144)
km = kmeans(normTrain,centers = 3 )
table(km$cluster)


   1    2    3 
3157 4696  253

Which cluster has the largest number of observations?

Cluster 2

3.5

Recall from the recitation that we can use the flexclust package to obtain training set and testing set cluster assignments for our observations (note that the call to as.kcca may take a while to complete):

km.kcca = flexclust::as.kcca(km, normTrain) 
clusterTrain = predict(km.kcca)
clusterTest = predict(km.kcca, newdata=normTest)

table(clusterTest)

clusterTest
   1    2    3 
1298 2080   96

How many test-set observations were assigned to Cluster 2?

2080

4. 邏輯式回歸，分群模型

4.1 依集群分析的結果切割資料

Using the subset function, build data frames stocksTrain1, stocksTrain2, and stocksTrain3, containing the elements in the stocksTrain data frame assigned to clusters 1, 2, and 3, respectively (be careful to take subsets of stocksTrain, not of normTrain). Similarly build stocksTest1, stocksTest2, and stocksTest3 from the stocksTest data frame.

stocksTrain1 = subset(stocksTrain,clusterTrain==1)
stocksTrain2 = subset(stocksTrain,clusterTrain==2)
stocksTrain3 = subset(stocksTrain,clusterTrain==3)
stocksTest1 = subset(stocksTest,clusterTest==1)
stocksTest2 = subset(stocksTest,clusterTest==2)
stocksTest3 = subset(stocksTest,clusterTest==3)
tapply(stocksTrain$PositiveDec, clusterTrain, mean)

       1        2        3 
0.602471 0.514055 0.438735

Which training set data frame has the highest average value of the dependent variable?

stocksTrain1

4.2 分群模型，模型係數

Build logistic regression models StocksModel1, StocksModel2, and StocksModel3, which predict PositiveDec using all the other variables as independent variables. StocksModel1 should be trained on stocksTrain1, StocksModel2 should be trained on stocksTrain2, and StocksModel3 should be trained on stocksTrain3.

StocksModel1 = glm(PositiveDec~., data = stocksTrain1,family = binomial)
StocksModel = lapply(split(stocksTrain,clusterTrain),function(x) 
   glm(PositiveDec~.,data=x,family = binomial))
sapply(StocksModel,coef)

                     1         2           3
(Intercept)  0.1722399  0.102932 -0.18189581
ReturnJan    0.0249836  0.884515 -0.00978934
ReturnFeb   -0.3720737  0.317622 -0.04688326
ReturnMar    0.5955496 -0.379781  0.67417950
ReturnApr    1.1904775  0.492910  1.28146619
ReturnMay    0.3042091  0.896549  0.76251155
ReturnJune  -0.0116538  1.500879  0.32943392
ReturnJuly   0.1976923  0.783149  0.77416437
ReturnAug    0.5127294 -0.244860  0.98260539
ReturnSep    0.5883269  0.736852  0.36380682
ReturnOct   -1.0225351 -0.277563  0.78224209
ReturnNov   -0.7484719 -0.787474 -0.87375214

Which variables have a positive sign for the coefficient in at least one model and a negative sign for the coefficient in at least one model? Select all that apply.

ReturnJan ,ReturnFeb,ReturnMar ,ReturnJune,ReturnAug,ReturnOct

4.3 分群模型：分群測試準確率，$\text{acc}_{test}^{1,2,3}$

Using StocksModel1, make test-set predictions called PredictTest1 on the data frame stocksTest1. Using StocksModel2, make test-set predictions called PredictTest2 on the data frame stocksTest2. Using StocksModel3, make test-set predictions called PredictTest3 on the data frame stocksTest3.

StocksTestModel = lapply(split(stocksTest,clusterTest),function(x) 
   glm(PositiveDec~.,data=x,family = binomial))
Pred = lapply(1:3, function(i)
  predict(StocksTestModel[[i]],stocksTest[clusterTest==i,],type="response"))
sapply(1:3, function(i) 
  table(stocksTest$PositiveDec[clusterTest==i], Pred[[i]] > 0.5) %>% {sum(diag(.))/sum(.)}  )

[1] 0.618644 0.545192 0.635417

What is the overall accuracy of StocksModel1 on the test set stocksTest1, using a threshold of 0.5?

0.618644

What is the overall accuracy of StocksModel2 on the test set stocksTest3, using a threshold of 0.5?

0.545192

What is the overall accuracy of StocksModel3 on the test set stocksTest3, using a threshold of 0.5?

0.635417

4.4 分群模型：整體測試準確率，$\text{acc}_{test}^{1+2+3}$

To compute the overall test-set accuracy of the cluster-then-predict approach, we can combine all the test-set predictions into a single vector and all the true outcomes into a single vector:

table( do.call(c, split(stocksTest$PositiveDec,clusterTest)), do.call(c, Pred) > 0.5 ) %>%
  {sum(diag(.))/sum(.)}

[1] 0.57513

What is the overall test-set accuracy of the cluster-then-predict approach, again using a threshold of 0.5?

0.57513

We see a modest improvement over the original logistic regression model. Since predicting stock returns is a notoriously hard problem, this is a good increase in accuracy. By investing in stocks for which we are more confident that they will have positive returns (by selecting the ones with higher predicted probabilities), this cluster-then-predict model can give us an edge over the original logistic regression model.

LS0tDQp0aXRsZTogIkFTNi0zIEdyb3VwNCDpoJDmuKzogqHnpajnmoTmipXos4floLHphawiDQphdXRob3I6ICLnjovmrKMsIE0wNjQxMTEwMzkiDQpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sNCi0tLQ0KDQo8YnI+DQoNCioq5Li76KaB6K2w6aGM77ya6aCQ5ris6IKh56Wo55qE5oqV6LOH5aCx6YWsKioNCg0KKirlrbjnv5Lph43pu57vvJoqKg0KDQorIOWFiOWIhue+pOS7peW+jOOAgeWGjeWBmumgkOa4rOaAp+aooeWeiw0KKyDpm4bnvqTliIbmnpDnmoTmqKHlnovoiIfpoJDmuKzmlrnms5UNCisgDQoNCg0KYGBge3IgZWNobz1ULCBtZXNzYWdlPUYsIGNhY2hlPUYsIHdhcm5pbmc9Rn0NCnJtKGxpc3Q9bHMoYWxsPVQpKQ0KU3lzLnNldGxvY2FsZSgiTENfQUxMIiwiQyIpDQpvcHRpb25zKGRpZ2l0cz02LCBzY2lwZW49MTIpDQpsaWJyYXJ5KGRwbHlyKQ0KbGlicmFyeShjYVRvb2xzKQ0KbGlicmFyeShjYXJldCkNCmxpYnJhcnkoZmxleGNsdXN0KQ0KYGBgDQo8YnI+DQoNCg0KLSAtIC0NCg0KIyMjIDEuIOizh+aWmeaOoue0og0KDQojIyMjIyAxLjEgDQpMb2FkIFN0b2Nrc0NsdXN0ZXIuY3N2IGludG8gYSBkYXRhIGZyYW1lIGNhbGxlZCAic3RvY2tzIi4NCmBgYHtyfQ0Kc3RvY2tzID0gcmVhZC5jc3YoImRhdGEvU3RvY2tzQ2x1c3Rlci5jc3YiKQ0KbnJvdyhzdG9ja3MpDQpgYGANCl9Ib3cgbWFueSBvYnNlcnZhdGlvbnMgYXJlIGluIHRoZSBkYXRhc2V0P18NCg0KKyAxMTU4MA0KDQojIyMjIyAxLjIgDQpgYGB7cn0NCnN1bShzdG9ja3MkUG9zaXRpdmVEZWM9PTEpIC8gbnJvdyhzdG9ja3MpDQpgYGANCl9XaGF0IHByb3BvcnRpb24gb2YgdGhlIG9ic2VydmF0aW9ucyBoYXZlIHBvc2l0aXZlIHJldHVybnMgaW4gRGVjZW1iZXI/Xw0KDQorIDAuNTQ2MTE0DQoNCiMjIyMjIDEuMw0KYGBge3J9DQpuYW1lcyhzdG9ja3MpDQpjb3Ioc3RvY2tzWywxOjExXSkgJT4lIHNvcnQgDQojICAwLjE5MTY3Mjc4NiANCmNvcihzdG9ja3NbLDE6MTFdKQ0KDQpgYGANCl9XaGF0IGlzIHRoZSBtYXhpbXVtIGNvcnJlbGF0aW9uIGJldHdlZW4gYW55IHR3byByZXR1cm4gdmFyaWFibGVzIGluIHRoZSBkYXRhc2V0P18gWW91IHNob3VsZCBsb29rIGF0IHRoZSBwYWlyd2lzZSBjb3JyZWxhdGlvbnMgYmV0d2VlbiBSZXR1cm5KYW4sIFJldHVybkZlYiwgUmV0dXJuTWFyLCBSZXR1cm5BcHIsIFJldHVybk1heSwgUmV0dXJuSnVuZSwgUmV0dXJuSnVseSwgUmV0dXJuQXVnLCBSZXR1cm5TZXAsIFJldHVybk9jdCwgYW5kIFJldHVybk5vdi4NCg0KKyBiZXR3ZWVuIFJldHVybk9jdCBhbmQgUmV0dXJuTm92Lg0KDQoNCiMjIyMjIDEuNA0KYGBge3IgZmlnLmhlaWdodD0zLCBmaWcud2lkdGg9Ni40fQ0KY29sTWVhbnMoc3RvY2tzWywxOjExXSkgICU+JSBzb3J0KCkNCg0KYGBgDQpfV2hpY2ggbW9udGggKGZyb20gSmFudWFyeSB0aHJvdWdoIE5vdmVtYmVyKSBoYXMgdGhlIGxhcmdlc3QgbWVhbiByZXR1cm4gYWNyb3NzIGFsbCBvYnNlcnZhdGlvbnMgaW4gdGhlIGRhdGFzZXQ/Xw0KDQorIEFwcmlsDQoNCl9XaGljaCBtb250aCAoZnJvbSBKYW51YXJ5IHRocm91Z2ggTm92ZW1iZXIpIGhhcyB0aGUgc21hbGxlc3QgbWVhbiByZXR1cm4gYWNyb3NzIGFsbCBvYnNlcnZhdGlvbnMgaW4gdGhlIGRhdGFzZXQ/Xw0KDQorIFNlcHRlbWJlcg0KDQo8YnI+DQoNCi0gLSAtDQoNCiMjIyAyLiDpgo/ovK/lvI/lm57mrbjvvIzllq7kuIDmqKHlnosNCg0KIyMjIyMg5YiG5Ymy6KiT57e044CB5ris6Kmm6LOH5paZDQpSdW4gdGhlIGZvbGxvd2luZyBjb21tYW5kcyB0byBzcGxpdCB0aGUgZGF0YSBpbnRvIGEgdHJhaW5pbmcgc2V0IGFuZCB0ZXN0aW5nIHNldCwgcHV0dGluZyA3MCUgb2YgdGhlIGRhdGEgaW4gdGhlIHRyYWluaW5nIHNldCBhbmQgMzAlIG9mIHRoZSBkYXRhIGluIHRoZSB0ZXN0aW5nIHNldDoNCg0Kc2V0LnNlZWQoMTQ0KQ0KDQpzcGwgPSBzYW1wbGUuc3BsaXQoc3RvY2tzJFBvc2l0aXZlRGVjLCBTcGxpdFJhdGlvID0gMC43KQ0KDQpzdG9ja3NUcmFpbiA9IHN1YnNldChzdG9ja3MsIHNwbCA9PSBUUlVFKQ0KDQpzdG9ja3NUZXN0ID0gc3Vic2V0KHN0b2Nrcywgc3BsID09IEZBTFNFKQ0KDQpgYGB7cn0NCnNldC5zZWVkKDE0NCkNCnNwbCA9IHNhbXBsZS5zcGxpdChzdG9ja3MkUG9zaXRpdmVEZWMsIFNwbGl0UmF0aW8gPSAwLjcpDQpzdG9ja3NUcmFpbiA9IHN1YnNldChzdG9ja3MsIHNwbCA9PSBUUlVFKQ0Kc3RvY2tzVGVzdCA9IHN1YnNldChzdG9ja3MsIHNwbCA9PSBGQUxTRSkNClN0b2Nrc01vZGVsID0gZ2xtKFBvc2l0aXZlRGVjIH4uLGRhdGE9c3RvY2tzVHJhaW4sIGZhbWlseT1iaW5vbWlhbCkNCmBgYA0KDQojIyMjIyAyLjEg5Zau5LiA5qih5Z6L77ya6KiT57e05rqW56K6546H77yMJFx0ZXh0e2FjY31fe3RyYWlufSQNClRoZW4sIHVzZSB0aGUgc3RvY2tzVHJhaW4gZGF0YSBmcmFtZSB0byB0cmFpbiBhIGxvZ2lzdGljIHJlZ3Jlc3Npb24gbW9kZWwgKG5hbWUgaXQgU3RvY2tzTW9kZWwpIHRvIHByZWRpY3QgUG9zaXRpdmVEZWMgdXNpbmcgYWxsIHRoZSBvdGhlciB2YXJpYWJsZXMgYXMgaW5kZXBlbmRlbnQgdmFyaWFibGVzLiBEb24ndCBmb3JnZXQgdG8gYWRkIHRoZSBhcmd1bWVudCBmYW1pbHk9Ymlub21pYWwgdG8geW91ciBnbG0gY29tbWFuZC4NCg0KYGBge3J9DQpQcmVkaWN0VHJhaW4gPSBwcmVkaWN0KFN0b2Nrc01vZGVsLCB0eXBlPSJyZXNwb25zZSIpDQpBID0gdGFibGUoc3RvY2tzVHJhaW4kUG9zaXRpdmVEZWMsIFByZWRpY3RUcmFpbiA+IDAuNSkNCnN1bShkaWFnKEEpKS9zdW0oQSkNCmBgYA0KX1doYXQgaXMgdGhlIG92ZXJhbGwgYWNjdXJhY3kgb24gdGhlIHRyYWluaW5nIHNldCwgdXNpbmcgYSB0aHJlc2hvbGQgb2YgMC41P18NCg0KKyAwLjU3MTE4Mg0KDQojIyMjIyAyLjIg5Zau5LiA5qih5Z6L77ya5ris6Kmm5rqW56K6546H77yMJFx0ZXh0e2FjY31fe3Rlc3R9JA0KYGBge3J9DQpQcmVkaWN0VGVzdCA9IHByZWRpY3QoU3RvY2tzTW9kZWwsIG5ld2RhdGE9c3RvY2tzVGVzdCAsdHlwZT0icmVzcG9uc2UiKQ0KQiA9IHRhYmxlKHN0b2Nrc1Rlc3QkUG9zaXRpdmVEZWMsIFByZWRpY3RUZXN0ID4gMC41KQ0Kc3VtKGRpYWcoQikpL3N1bShCKQ0KYGBgDQpfTm93IG9idGFpbiB0ZXN0IHNldCBwcmVkaWN0aW9ucyBmcm9tIFN0b2Nrc01vZGVsLiBXaGF0IGlzIHRoZSBvdmVyYWxsIGFjY3VyYWN5IG9mIHRoZSBtb2RlbCBvbiB0aGUgdGVzdCwgYWdhaW4gdXNpbmcgYSB0aHJlc2hvbGQgb2YgMC41P18NCg0KKyAwLjU2NzA3DQoNCiMjIyMjIDIuMyDllq7kuIDmqKHlnovvvJrlupXnt5rmupbnorrnjofvvIwkXHRleHR7YWNjfV97YmFzZWxpbmV9JA0KYGBge3J9DQp0YWJsZShzdG9ja3NUZXN0JFBvc2l0aXZlRGVjKQ0KQyA9IHRhYmxlKHN0b2Nrc1Rlc3QkUG9zaXRpdmVEZWMsIHN0b2Nrc1Rlc3QkUG9zaXRpdmVEZWM9PTEpDQoxODk3L25yb3coc3RvY2tzVGVzdCkNCg0KYGBgDQpfV2hhdCBpcyB0aGUgYWNjdXJhY3kgb24gdGhlIHRlc3Qgc2V0IG9mIGEgYmFzZWxpbmUgbW9kZWwgdGhhdCBhbHdheXMgcHJlZGljdHMgdGhlIG1vc3QgY29tbW9uIG91dGNvbWUgKFBvc2l0aXZlRGVjID0gMSk/Xw0KDQorIDAuNTQ2MDU2DQoNCjxicj4NCg0KLSAtIC0NCg0KIyMjIDMuIOmbhue+pOWIhuaekA0KDQojIyMjIyAzLjEg56e76Zmk55uu5qiZ6K6K5pW4DQpOb3csIGxldCdzIGNsdXN0ZXIgdGhlIHN0b2Nrcy4gVGhlIGZpcnN0IHN0ZXAgaW4gdGhpcyBwcm9jZXNzIGlzIHRvIHJlbW92ZSB0aGUgZGVwZW5kZW50IHZhcmlhYmxlIHVzaW5nIHRoZSBmb2xsb3dpbmcgY29tbWFuZHM6DQpgYGB7cn0NCg0KbGltaXRlZFRyYWluID0gc3RvY2tzVHJhaW4NCg0KbGltaXRlZFRyYWluJFBvc2l0aXZlRGVjID0gTlVMTA0KDQpsaW1pdGVkVGVzdCA9IHN0b2Nrc1Rlc3QNCg0KbGltaXRlZFRlc3QkUG9zaXRpdmVEZWMgPSBOVUxMDQoNCmBgYA0KX1doeSBkbyB3ZSBuZWVkIHRvIHJlbW92ZSB0aGUgZGVwZW5kZW50IHZhcmlhYmxlIGluIHRoZSBjbHVzdGVyaW5nIHBoYXNlIG9mIHRoZSBjbHVzdGVyLXRoZW4tcHJlZGljdCBtZXRob2RvbG9neT9fDQoNCisgTmVlZGluZyB0byBrbm93IHRoZSBkZXBlbmRlbnQgdmFyaWFibGUgdmFsdWUgdG8gYXNzaWduIGFuIG9ic2VydmF0aW9uIHRvIGEgY2x1c3RlciBkZWZlYXRzIHRoZSBwdXJwb3NlIG9mIHRoZSBtZXRob2RvbG9neQ0KDQojIyMjIyAzLjIg5Y2A6ZqU6K6K5pW45bi45oWL5YyWDQpJbiB0aGUgbWFya2V0IHNlZ21lbnRhdGlvbiBhc3NpZ25tZW50IGluIHRoaXMgd2VlaydzIGhvbWV3b3JrLCB5b3Ugd2VyZSBpbnRyb2R1Y2VkIHRvIHRoZSBwcmVQcm9jZXNzIGNvbW1hbmQgZnJvbSB0aGUgY2FyZXQgcGFja2FnZSwgd2hpY2ggbm9ybWFsaXplcyB2YXJpYWJsZXMgYnkgc3VidHJhY3RpbmcgYnkgdGhlIG1lYW4gYW5kIGRpdmlkaW5nIGJ5IHRoZSBzdGFuZGFyZCBkZXZpYXRpb24uDQoNCkluIGNhc2VzIHdoZXJlIHdlIGhhdmUgYSB0cmFpbmluZyBhbmQgdGVzdGluZyBzZXQsIHdlJ2xsIHdhbnQgdG8gbm9ybWFsaXplIGJ5IHRoZSBtZWFuIGFuZCBzdGFuZGFyZCBkZXZpYXRpb24gb2YgdGhlIHZhcmlhYmxlcyBpbiB0aGUgdHJhaW5pbmcgc2V0LiBXZSBjYW4gZG8gdGhpcyBieSBwYXNzaW5nIGp1c3QgdGhlIHRyYWluaW5nIHNldCB0byB0aGUgcHJlUHJvY2VzcyBmdW5jdGlvbjoNCmBgYHtyfQ0KbGlicmFyeShjYXJldCkNCg0KcHJlcHJvYyA9IHByZVByb2Nlc3MobGltaXRlZFRyYWluKQ0KDQpub3JtVHJhaW4gPSBwcmVkaWN0KHByZXByb2MsIGxpbWl0ZWRUcmFpbikNCg0Kbm9ybVRlc3QgPSBwcmVkaWN0KHByZXByb2MsIGxpbWl0ZWRUZXN0KQ0KYGBgDQoNCmBgYHtyfQ0KbWVhbihub3JtVHJhaW4kUmV0dXJuSmFuKQ0KDQpgYGANCl9XaGF0IGlzIHRoZSBtZWFuIG9mIHRoZSBSZXR1cm5KYW4gdmFyaWFibGUgaW4gbm9ybVRyYWluP18NCg0KKyAyLjEwMDU5ZS0xNw0KDQoNCmBgYHtyfQ0KbWVhbihub3JtVGVzdCRSZXR1cm5KYW4pDQpgYGANCl9XaGF0IGlzIHRoZSBtZWFuIG9mIHRoZSBSZXR1cm5KYW4gdmFyaWFibGUgaW4gbm9ybVRlc3Q/Xw0KDQorIC0wLjAwMDQxODU4OQ0KDQojIyMjIyAzLjMg5ris6Kmm6LOH5paZ55qE5bi45oWL5YyW57WQ5p6cDQpfV2h5IGlzIHRoZSBtZWFuIFJldHVybkphbiB2YXJpYWJsZSBtdWNoIGNsb3NlciB0byAwIGluIG5vcm1UcmFpbiB0aGFuIGluIG5vcm1UZXN0P18NCg0KKyBUaGUgZGlzdHJpYnV0aW9uIG9mIHRoZSBSZXR1cm5KYW4gdmFyaWFibGUgaXMgZGlmZmVyZW50IGluIHRoZSB0cmFpbmluZyBhbmQgdGVzdGluZyBzZXQNCg0KIyMjIyMgMy40IEstTWVhbnPpm4bnvqQNClNldCB0aGUgcmFuZG9tIHNlZWQgdG8gMTQ0IChpdCBpcyBpbXBvcnRhbnQgdG8gZG8gdGhpcyBhZ2FpbiwgZXZlbiB0aG91Z2ggd2UgZGlkIGl0IGVhcmxpZXIpLiBSdW4gay1tZWFucyBjbHVzdGVyaW5nIHdpdGggMyBjbHVzdGVycyBvbiBub3JtVHJhaW4sIHN0b3JpbmcgdGhlIHJlc3VsdCBpbiBhbiBvYmplY3QgY2FsbGVkIGttLg0KYGBge3J9DQpzZXQuc2VlZCgxNDQpDQprbSA9IGttZWFucyhub3JtVHJhaW4sY2VudGVycyA9IDMgKQ0KdGFibGUoa20kY2x1c3RlcikNCg0KYGBgDQoNCg0KX1doaWNoIGNsdXN0ZXIgaGFzIHRoZSBsYXJnZXN0IG51bWJlciBvZiBvYnNlcnZhdGlvbnM/Xw0KDQorIENsdXN0ZXIgMg0KDQojIyMjIyAzLjUNClJlY2FsbCBmcm9tIHRoZSByZWNpdGF0aW9uIHRoYXQgd2UgY2FuIHVzZSB0aGUgZmxleGNsdXN0IHBhY2thZ2UgdG8gb2J0YWluIHRyYWluaW5nIHNldCBhbmQgdGVzdGluZyBzZXQgY2x1c3RlciBhc3NpZ25tZW50cyBmb3Igb3VyIG9ic2VydmF0aW9ucyAobm90ZSB0aGF0IHRoZSBjYWxsIHRvIGFzLmtjY2EgbWF5IHRha2UgYSB3aGlsZSB0byBjb21wbGV0ZSk6DQpgYGB7cn0NCmttLmtjY2EgPSBmbGV4Y2x1c3Q6OmFzLmtjY2Eoa20sIG5vcm1UcmFpbikgDQpjbHVzdGVyVHJhaW4gPSBwcmVkaWN0KGttLmtjY2EpDQpjbHVzdGVyVGVzdCA9IHByZWRpY3Qoa20ua2NjYSwgbmV3ZGF0YT1ub3JtVGVzdCkNCmBgYA0KDQpgYGB7cn0NCnRhYmxlKGNsdXN0ZXJUZXN0KQ0KYGBgDQpfSG93IG1hbnkgdGVzdC1zZXQgb2JzZXJ2YXRpb25zIHdlcmUgYXNzaWduZWQgdG8gQ2x1c3RlciAyP18NCg0KKyAyMDgwDQoNCjxicj4NCg0KLSAtIC0NCg0KIyMjIDQuIOmCj+i8r+W8j+WbnuatuO+8jOWIhue+pOaooeWeiw0KDQojIyMjIyA0LjEg5L6d6ZuG576k5YiG5p6Q55qE57WQ5p6c5YiH5Ymy6LOH5paZDQpVc2luZyB0aGUgc3Vic2V0IGZ1bmN0aW9uLCBidWlsZCBkYXRhIGZyYW1lcyBzdG9ja3NUcmFpbjEsIHN0b2Nrc1RyYWluMiwgYW5kIHN0b2Nrc1RyYWluMywgY29udGFpbmluZyB0aGUgZWxlbWVudHMgaW4gdGhlIHN0b2Nrc1RyYWluIGRhdGEgZnJhbWUgYXNzaWduZWQgdG8gY2x1c3RlcnMgMSwgMiwgYW5kIDMsIHJlc3BlY3RpdmVseSAoYmUgY2FyZWZ1bCB0byB0YWtlIHN1YnNldHMgb2Ygc3RvY2tzVHJhaW4sIG5vdCBvZiBub3JtVHJhaW4pLiBTaW1pbGFybHkgYnVpbGQgc3RvY2tzVGVzdDEsIHN0b2Nrc1Rlc3QyLCBhbmQgc3RvY2tzVGVzdDMgZnJvbSB0aGUgc3RvY2tzVGVzdCBkYXRhIGZyYW1lLg0KDQpgYGB7cn0NCnN0b2Nrc1RyYWluMSA9IHN1YnNldChzdG9ja3NUcmFpbixjbHVzdGVyVHJhaW49PTEpDQpzdG9ja3NUcmFpbjIgPSBzdWJzZXQoc3RvY2tzVHJhaW4sY2x1c3RlclRyYWluPT0yKQ0Kc3RvY2tzVHJhaW4zID0gc3Vic2V0KHN0b2Nrc1RyYWluLGNsdXN0ZXJUcmFpbj09MykNCnN0b2Nrc1Rlc3QxID0gc3Vic2V0KHN0b2Nrc1Rlc3QsY2x1c3RlclRlc3Q9PTEpDQpzdG9ja3NUZXN0MiA9IHN1YnNldChzdG9ja3NUZXN0LGNsdXN0ZXJUZXN0PT0yKQ0Kc3RvY2tzVGVzdDMgPSBzdWJzZXQoc3RvY2tzVGVzdCxjbHVzdGVyVGVzdD09MykNCg0KdGFwcGx5KHN0b2Nrc1RyYWluJFBvc2l0aXZlRGVjLCBjbHVzdGVyVHJhaW4sIG1lYW4pDQoNCmBgYA0KX1doaWNoIHRyYWluaW5nIHNldCBkYXRhIGZyYW1lIGhhcyB0aGUgaGlnaGVzdCBhdmVyYWdlIHZhbHVlIG9mIHRoZSBkZXBlbmRlbnQgdmFyaWFibGU/Xw0KDQorIHN0b2Nrc1RyYWluMQ0KKw0KDQojIyMjIyA0LjIg5YiG576k5qih5Z6L77yM5qih5Z6L5L+C5pW4DQpCdWlsZCBsb2dpc3RpYyByZWdyZXNzaW9uIG1vZGVscyBTdG9ja3NNb2RlbDEsIFN0b2Nrc01vZGVsMiwgYW5kIFN0b2Nrc01vZGVsMywgd2hpY2ggcHJlZGljdCBQb3NpdGl2ZURlYyB1c2luZyBhbGwgdGhlIG90aGVyIHZhcmlhYmxlcyBhcyBpbmRlcGVuZGVudCB2YXJpYWJsZXMuIFN0b2Nrc01vZGVsMSBzaG91bGQgYmUgdHJhaW5lZCBvbiBzdG9ja3NUcmFpbjEsIFN0b2Nrc01vZGVsMiBzaG91bGQgYmUgdHJhaW5lZCBvbiBzdG9ja3NUcmFpbjIsIGFuZCBTdG9ja3NNb2RlbDMgc2hvdWxkIGJlIHRyYWluZWQgb24gc3RvY2tzVHJhaW4zLg0KYGBge3J9DQpTdG9ja3NNb2RlbDEgPSBnbG0oUG9zaXRpdmVEZWN+LiwgZGF0YSA9IHN0b2Nrc1RyYWluMSxmYW1pbHkgPSBiaW5vbWlhbCkNClN0b2Nrc01vZGVsID0gbGFwcGx5KHNwbGl0KHN0b2Nrc1RyYWluLGNsdXN0ZXJUcmFpbiksZnVuY3Rpb24oeCkgDQogICBnbG0oUG9zaXRpdmVEZWN+LixkYXRhPXgsZmFtaWx5ID0gYmlub21pYWwpKQ0Kc2FwcGx5KFN0b2Nrc01vZGVsLGNvZWYpDQoNCmBgYA0KDQpfV2hpY2ggdmFyaWFibGVzIGhhdmUgYSBwb3NpdGl2ZSBzaWduIGZvciB0aGUgY29lZmZpY2llbnQgaW4gYXQgbGVhc3Qgb25lIG1vZGVsIGFuZCBhIG5lZ2F0aXZlIHNpZ24gZm9yIHRoZSBjb2VmZmljaWVudCBpbiBhdCBsZWFzdCBvbmUgbW9kZWw/XyBTZWxlY3QgYWxsIHRoYXQgYXBwbHkuDQoNCisgUmV0dXJuSmFuICxSZXR1cm5GZWIsUmV0dXJuTWFyICxSZXR1cm5KdW5lLFJldHVybkF1ZyxSZXR1cm5PY3QNCg0KIyMjIyMgNC4zIOWIhue+pOaooeWei++8muWIhue+pOa4rOippua6lueiuueOh++8jCRcdGV4dHthY2N9X3t0ZXN0fV57MSwyLDN9JA0KVXNpbmcgU3RvY2tzTW9kZWwxLCBtYWtlIHRlc3Qtc2V0IHByZWRpY3Rpb25zIGNhbGxlZCBQcmVkaWN0VGVzdDEgb24gdGhlIGRhdGEgZnJhbWUgc3RvY2tzVGVzdDEuIFVzaW5nIFN0b2Nrc01vZGVsMiwgbWFrZSB0ZXN0LXNldCBwcmVkaWN0aW9ucyBjYWxsZWQgUHJlZGljdFRlc3QyIG9uIHRoZSBkYXRhIGZyYW1lIHN0b2Nrc1Rlc3QyLiBVc2luZyBTdG9ja3NNb2RlbDMsIG1ha2UgdGVzdC1zZXQgcHJlZGljdGlvbnMgY2FsbGVkIFByZWRpY3RUZXN0MyBvbiB0aGUgZGF0YSBmcmFtZSBzdG9ja3NUZXN0My4NCmBgYHtyfQ0KU3RvY2tzVGVzdE1vZGVsID0gbGFwcGx5KHNwbGl0KHN0b2Nrc1Rlc3QsY2x1c3RlclRlc3QpLGZ1bmN0aW9uKHgpIA0KICAgZ2xtKFBvc2l0aXZlRGVjfi4sZGF0YT14LGZhbWlseSA9IGJpbm9taWFsKSkNCg0KUHJlZCA9IGxhcHBseSgxOjMsIGZ1bmN0aW9uKGkpDQogIHByZWRpY3QoU3RvY2tzVGVzdE1vZGVsW1tpXV0sc3RvY2tzVGVzdFtjbHVzdGVyVGVzdD09aSxdLHR5cGU9InJlc3BvbnNlIikpDQoNCnNhcHBseSgxOjMsIGZ1bmN0aW9uKGkpIA0KICB0YWJsZShzdG9ja3NUZXN0JFBvc2l0aXZlRGVjW2NsdXN0ZXJUZXN0PT1pXSwgUHJlZFtbaV1dID4gMC41KSAlPiUge3N1bShkaWFnKC4pKS9zdW0oLil9ICApDQpgYGANCl9XaGF0IGlzIHRoZSBvdmVyYWxsIGFjY3VyYWN5IG9mIFN0b2Nrc01vZGVsMSBvbiB0aGUgdGVzdCBzZXQgc3RvY2tzVGVzdDEsIHVzaW5nIGEgdGhyZXNob2xkIG9mIDAuNT9fDQoNCisgMC42MTg2NDQNCg0KX1doYXQgaXMgdGhlIG92ZXJhbGwgYWNjdXJhY3kgb2YgU3RvY2tzTW9kZWwyIG9uIHRoZSB0ZXN0IHNldCBzdG9ja3NUZXN0MywgdXNpbmcgYSB0aHJlc2hvbGQgb2YgMC41P18NCg0KKyAwLjU0NTE5Mg0KDQpfV2hhdCBpcyB0aGUgb3ZlcmFsbCBhY2N1cmFjeSBvZiBTdG9ja3NNb2RlbDMgb24gdGhlIHRlc3Qgc2V0IHN0b2Nrc1Rlc3QzLCB1c2luZyBhIHRocmVzaG9sZCBvZiAwLjU/Xw0KDQorIDAuNjM1NDE3DQoNCiMjIyMjIDQuNCDliIbnvqTmqKHlnovvvJrmlbTpq5TmuKzoqabmupbnorrnjofvvIwkXHRleHR7YWNjfV97dGVzdH1eezErMiszfSQNClRvIGNvbXB1dGUgdGhlIG92ZXJhbGwgdGVzdC1zZXQgYWNjdXJhY3kgb2YgdGhlIGNsdXN0ZXItdGhlbi1wcmVkaWN0IGFwcHJvYWNoLCB3ZSBjYW4gY29tYmluZSBhbGwgdGhlIHRlc3Qtc2V0IHByZWRpY3Rpb25zIGludG8gYSBzaW5nbGUgdmVjdG9yIGFuZCBhbGwgdGhlIHRydWUgb3V0Y29tZXMgaW50byBhIHNpbmdsZSB2ZWN0b3I6DQpgYGB7cn0NCnRhYmxlKCBkby5jYWxsKGMsIHNwbGl0KHN0b2Nrc1Rlc3QkUG9zaXRpdmVEZWMsY2x1c3RlclRlc3QpKSwgZG8uY2FsbChjLCBQcmVkKSA+IDAuNSApICU+JQ0KICB7c3VtKGRpYWcoLikpL3N1bSguKX0NCmBgYA0KDQpfV2hhdCBpcyB0aGUgb3ZlcmFsbCB0ZXN0LXNldCBhY2N1cmFjeSBvZiB0aGUgY2x1c3Rlci10aGVuLXByZWRpY3QgYXBwcm9hY2gsIGFnYWluIHVzaW5nIGEgdGhyZXNob2xkIG9mIDAuNT9fDQoNCisgMC41NzUxMw0KDQoNCldlIHNlZSBhIG1vZGVzdCBpbXByb3ZlbWVudCBvdmVyIHRoZSBvcmlnaW5hbCBsb2dpc3RpYyByZWdyZXNzaW9uIG1vZGVsLiBTaW5jZSBwcmVkaWN0aW5nIHN0b2NrIHJldHVybnMgaXMgYSBub3RvcmlvdXNseSBoYXJkIHByb2JsZW0sIHRoaXMgaXMgYSBnb29kIGluY3JlYXNlIGluIGFjY3VyYWN5LiBCeSBpbnZlc3RpbmcgaW4gc3RvY2tzIGZvciB3aGljaCB3ZSBhcmUgbW9yZSBjb25maWRlbnQgdGhhdCB0aGV5IHdpbGwgaGF2ZSBwb3NpdGl2ZSByZXR1cm5zIChieSBzZWxlY3RpbmcgdGhlIG9uZXMgd2l0aCBoaWdoZXIgcHJlZGljdGVkIHByb2JhYmlsaXRpZXMpLCB0aGlzIGNsdXN0ZXItdGhlbi1wcmVkaWN0IG1vZGVsIGNhbiBnaXZlIHVzIGFuIGVkZ2Ugb3ZlciB0aGUgb3JpZ2luYWwgbG9naXN0aWMgcmVncmVzc2lvbiBtb2RlbC4NCg0KPGJyPg0KDQotIC0gLQ0KDQo8YnI+PGJyPjxicj48YnI+PGJyPg0KDQo8c3R5bGU+DQouY2FwdGlvbiB7DQogIGNvbG9yOiAjNzc3Ow0KICBtYXJnaW4tdG9wOiAxMHB4Ow0KfQ0KcCBjb2RlIHsNCiAgd2hpdGUtc3BhY2U6IGluaGVyaXQ7DQp9DQpwcmUgew0KICB3b3JkLWJyZWFrOiBub3JtYWw7DQogIHdvcmQtd3JhcDogbm9ybWFsOw0KICBsaW5lLWhlaWdodDogMTsNCn0NCnByZSBjb2RlIHsNCiAgd2hpdGUtc3BhY2U6IGluaGVyaXQ7DQp9DQpwLGxpIHsNCiAgZm9udC1mYW1pbHk6ICJUcmVidWNoZXQgTVMiLCAi5b6u6Luf5q2j6buR6auUIiwgIk1pY3Jvc29mdCBKaGVuZ0hlaSI7DQp9DQoNCi5yew0KICBsaW5lLWhlaWdodDogMS4yOw0KfQ0KDQp0aXRsZXsNCiAgY29sb3I6ICNjYzAwMDA7DQogIGZvbnQtZmFtaWx5OiAiVHJlYnVjaGV0IE1TIiwgIuW+rui7n+ato+m7kemrlCIsICJNaWNyb3NvZnQgSmhlbmdIZWkiOw0KfQ0KDQpib2R5ew0KICBmb250LWZhbWlseTogIlRyZWJ1Y2hldCBNUyIsICLlvq7ou5/mraPpu5Hpq5QiLCAiTWljcm9zb2Z0IEpoZW5nSGVpIjsNCn0NCg0KaDEsaDIsaDMsaDQsaDV7DQogIGNvbG9yOiAjMDA4ODAwOw0KICBmb250LWZhbWlseTogIlRyZWJ1Y2hldCBNUyIsICLlvq7ou5/mraPpu5Hpq5QiLCAiTWljcm9zb2Z0IEpoZW5nSGVpIjsNCn0NCg0KaDN7DQogIGNvbG9yOiAjYjM2YjAwOw0KICBiYWNrZ3JvdW5kOiAjZmZlMGIzOw0KICBsaW5lLWhlaWdodDogMjsNCiAgZm9udC13ZWlnaHQ6IGJvbGQ7DQp9DQoNCmg1ew0KICBjb2xvcjogIzAwNjAwMDsNCiAgYmFja2dyb3VuZDogI2ZmZmZlMDsNCiAgbGluZS1oZWlnaHQ6IDI7DQogIGZvbnQtd2VpZ2h0OiBib2xkOw0KfQ0KDQplbXsNCiAgY29sb3I6ICMwMDAwYzA7DQogIGJhY2tncm91bmQ6ICNmMGYwZjA7DQogIH0NCjwvc3R5bGU+DQoNCg==

AS6-3 Group4 預測股票的投資報酬

王欣, M064111039

1. 資料探索

1.1

1.2

1.3

1.4

2. 邏輯式回歸，單一模型

分割訓練、測試資料

2.1 單一模型：訓練準確率，\(\text{acc}_{train}\)

2.2 單一模型：測試準確率，\(\text{acc}_{test}\)

2.3 單一模型：底線準確率，\(\text{acc}_{baseline}\)