MXNet LogisticRegressionOutputが上手く行かなかったtest（20160601追記で成功）

https://twitter.com/TJO_datasci/status/737588070225043457
この話があったので試してみました。

データ読み込み

library(mxnet)
data(Sonar, package="mlbench")
Sonar[,61] = as.numeric(Sonar[,61])-1
train.ind = c(1:50, 100:150)
train.x = data.matrix(Sonar[train.ind, 1:60])
train.y = Sonar[train.ind, 61]
test.x = data.matrix(Sonar[-train.ind, 1:60])
test.y = Sonar[-train.ind, 61]

まずは1層で動かしてみる

data <- mx.symbol.Variable("data")
fc1 <- mx.symbol.FullyConnected(data, num_hidden=1)
lro <- mx.symbol.LogisticRegressionOutput(fc1,name='lr')
mx.set.seed(0)
model <- mx.model.FeedForward.create(lro, X=train.x, y=train.y,
                                     ctx=mx.cpu(), num.round=20, array.batch.size=20,
                                     learning.rate=0.07, momentum=0.9, eval.metric=mx.metric.accuracy)

 mx.model.select.layout.train(X, y) で警告がありました: 
  Auto detect layout of input matrix, use rowmajor..

Start training with 1 devices
[1] Train-accuracy=0.52
[2] Train-accuracy=0.508333333333333
[3] Train-accuracy=0.508333333333333
[4] Train-accuracy=0.508333333333333
[5] Train-accuracy=0.508333333333333
[6] Train-accuracy=0.508333333333333
[7] Train-accuracy=0.508333333333333
[8] Train-accuracy=0.508333333333333
[9] Train-accuracy=0.508333333333333
[10] Train-accuracy=0.508333333333333
[11] Train-accuracy=0.508333333333333
[12] Train-accuracy=0.508333333333333
[13] Train-accuracy=0.508333333333333
[14] Train-accuracy=0.508333333333333
[15] Train-accuracy=0.508333333333333
[16] Train-accuracy=0.508333333333333
[17] Train-accuracy=0.508333333333333
[18] Train-accuracy=0.508333333333333
[19] Train-accuracy=0.508333333333333
[20] Train-accuracy=0.508333333333333

動いたがaccuracy上がらず。

多層なら？

data <- mx.symbol.Variable("data")
fc1 <-   mx.symbol.FullyConnected(data,  name="fc1", num_hidden=128) 
act1    <- mx.symbol.Activation(fc1, name="tanh1",   act_type="tanh") 
drop1   <-   mx.symbol.Dropout(act1, p = 0.1,    name="drop1") 
fc2 <-   mx.symbol.FullyConnected(drop1, name="fc2", num_hidden=64) 
act2    <-   mx.symbol.Activation(fc2,   name="tanh2",   act_type="tanh") 
drop2   <- mx.symbol.Dropout(act2,   p   =   0.1,    name="drop2") 
fc3 <-   mx.symbol.FullyConnected(drop2, name="fc3", num_hidden=1)
lro2<- mx.symbol.LogisticRegressionOutput(fc3)
mx.set.seed(0)
model <- mx.model.FeedForward.create(lro2, X=train.x, y=train.y,
                                     ctx=mx.cpu(), num.round=20, array.batch.size=20,
                                     learning.rate=0.07, momentum=0.9, eval.metric=mx.metric.accuracy)

 mx.model.select.layout.train(X, y) で警告がありました: 
  Auto detect layout of input matrix, use rowmajor..

Start training with 1 devices
[1] Train-accuracy=0.52
[2] Train-accuracy=0.508333333333333
[3] Train-accuracy=0.508333333333333
[4] Train-accuracy=0.508333333333333
[5] Train-accuracy=0.508333333333333
[6] Train-accuracy=0.508333333333333
[7] Train-accuracy=0.508333333333333
[8] Train-accuracy=0.508333333333333
[9] Train-accuracy=0.508333333333333
[10] Train-accuracy=0.508333333333333
[11] Train-accuracy=0.508333333333333
[12] Train-accuracy=0.508333333333333
[13] Train-accuracy=0.508333333333333
[14] Train-accuracy=0.508333333333333
[15] Train-accuracy=0.508333333333333
[16] Train-accuracy=0.508333333333333
[17] Train-accuracy=0.508333333333333
[18] Train-accuracy=0.508333333333333
[19] Train-accuracy=0.508333333333333
[20] Train-accuracy=0.508333333333333

上手く回らない。

mx.mlpからout_activation=“logistic”を呼んでみる

mx.set.seed(0)
model <- mx.mlp(train.x, train.y, hidden_node=10, out_node=1, out_activation="logistic",
                num.round=20, array.batch.size=15, learning.rate=0.07, momentum=0.9, 
                eval.metric=mx.metric.accuracy)

 mx.model.select.layout.train(X, y) で警告がありました: 
  Auto detect layout of input matrix, use rowmajor..

Start training with 1 devices
[1] Train-accuracy=0.533333333333333
[2] Train-accuracy=0.514285714285714
[3] Train-accuracy=0.514285714285714
[4] Train-accuracy=0.514285714285714
[5] Train-accuracy=0.514285714285714
[6] Train-accuracy=0.514285714285714
[7] Train-accuracy=0.514285714285714
[8] Train-accuracy=0.514285714285714
[9] Train-accuracy=0.514285714285714
[10] Train-accuracy=0.514285714285714
[11] Train-accuracy=0.514285714285714
[12] Train-accuracy=0.514285714285714
[13] Train-accuracy=0.514285714285714
[14] Train-accuracy=0.514285714285714
[15] Train-accuracy=0.514285714285714
[16] Train-accuracy=0.514285714285714
[17] Train-accuracy=0.514285714285714
[18] Train-accuracy=0.514285714285714
[19] Train-accuracy=0.514285714285714
[20] Train-accuracy=0.514285714285714

この方法でも全然だめ。

mx.mlpからout_activation=“softmax”を呼んでみる

mx.set.seed(0)
model <- mx.mlp(train.x, train.y, hidden_node=10, out_node=2, out_activation="softmax",
                num.round=20, array.batch.size=15, learning.rate=0.07, momentum=0.9, 
                eval.metric=mx.metric.accuracy)

 mx.model.select.layout.train(X, y) で警告がありました: 
  Auto detect layout of input matrix, use rowmajor..

Start training with 1 devices
[1] Train-accuracy=0.488888888888889
[2] Train-accuracy=0.514285714285714
[3] Train-accuracy=0.514285714285714
[4] Train-accuracy=0.514285714285714
[5] Train-accuracy=0.514285714285714
[6] Train-accuracy=0.523809523809524
[7] Train-accuracy=0.619047619047619
[8] Train-accuracy=0.695238095238095
[9] Train-accuracy=0.695238095238095
[10] Train-accuracy=0.761904761904762
[11] Train-accuracy=0.828571428571429
[12] Train-accuracy=0.771428571428571
[13] Train-accuracy=0.742857142857143
[14] Train-accuracy=0.733333333333333
[15] Train-accuracy=0.771428571428571
[16] Train-accuracy=0.847619047619048
[17] Train-accuracy=0.857142857142857
[18] Train-accuracy=0.838095238095238
[19] Train-accuracy=0.838095238095238
[20] Train-accuracy=0.838095238095238

softmaxならうまくいく、謎。

色々やってみたがだめ。
“out_node”とか“num_hidden”とか1以外にしたら動かないし全然わからん。
Weird LogisticRegressionOutput Bugにもnum_hiddenは1にしろとあったので間違いではないと思うが…。
trainのところをfactorにしてみたりもしたがaccuraryが0になって草が生えた。
結局あんまり役に立たないまとめになってしまいました。すいません。

20160601追記

https://twitter.com/TJO_datasci/status/737695141645803520
eval_metricに明示的にmx.MSE()を与えてやると解決するという話をTJOさんが見つけてくださったので試してみます。

data <- mx.symbol.Variable("data")
fc1 <- mx.symbol.FullyConnected(data, num_hidden=1)
lro <- mx.symbol.LogisticRegressionOutput(fc1,name='lr')
mx.set.seed(0)
model <- mx.model.FeedForward.create(lro, X=train.x, y=train.y,
                                     ctx=mx.cpu(), num.round=20, array.batch.size=20,
                                     learning.rate=0.07, momentum=0.9, eval.metric = mx.metric.rmse)

 mx.model.select.layout.train(X, y) で警告がありました: 
  Auto detect layout of input matrix, use rowmajor..

Start training with 1 devices
[1] Train-rmse=0.504584959621227
[2] Train-rmse=0.486834490415004
[3] Train-rmse=0.46832481273427
[4] Train-rmse=0.450686512770706
[5] Train-rmse=0.437911443769791
[6] Train-rmse=0.428250970255103
[7] Train-rmse=0.418913606529651
[8] Train-rmse=0.411397469249855
[9] Train-rmse=0.404743247435068
[10] Train-rmse=0.39870206817925
[11] Train-rmse=0.393734536261962
[12] Train-rmse=0.389228543948827
[13] Train-rmse=0.385115866876684
[14] Train-rmse=0.381506997094149
[15] Train-rmse=0.378147166001399
[16] Train-rmse=0.375042510549718
[17] Train-rmse=0.372218810990555
[18] Train-rmse=0.36957206621295
[19] Train-rmse=0.367103434140826
[20] Train-rmse=0.36481225805133

Rの場合だとeval.metric = mx.metric.rmseで行けるみたいですね。
勉強になりました。ありがとうございます。

参考
Neural Network with MXNet in Five Minutes
Weird LogisticRegressionOutput Bug
No learning using LogisticRegressionOutput. Mistaken net definition?

LS0tCnRpdGxlOiAiTVhOZXQgTG9naXN0aWNSZWdyZXNzaW9uT3V0cHV044GM5LiK5omL44GP6KGM44GL44Gq44GL44Gj44GfdGVzdO+8iDIwMTYwNjAx6L+96KiY44Gn5oiQ5Yqf77yJIgpvdXRwdXQ6CiAgaHRtbF9ub3RlYm9vazogZGVmYXVsdAogIGh0bWxfZG9jdW1lbnQ6IGRlZmF1bHQKLS0tCgpodHRwczovL3R3aXR0ZXIuY29tL1RKT19kYXRhc2NpL3N0YXR1cy83Mzc1ODgwNzAyMjUwNDM0NTcgIArjgZPjga7oqbHjgYzjgYLjgaPjgZ/jga7jgafoqabjgZfjgabjgb/jgb7jgZfjgZ/jgIIKCiMjI+ODh+ODvOOCv+iqreOBv+i+vOOBvwpgYGB7cn0KbGlicmFyeShteG5ldCkKZGF0YShTb25hciwgcGFja2FnZT0ibWxiZW5jaCIpCgpTb25hclssNjFdID0gYXMubnVtZXJpYyhTb25hclssNjFdKS0xCnRyYWluLmluZCA9IGMoMTo1MCwgMTAwOjE1MCkKdHJhaW4ueCA9IGRhdGEubWF0cml4KFNvbmFyW3RyYWluLmluZCwgMTo2MF0pCnRyYWluLnkgPSBTb25hclt0cmFpbi5pbmQsIDYxXQp0ZXN0LnggPSBkYXRhLm1hdHJpeChTb25hclstdHJhaW4uaW5kLCAxOjYwXSkKdGVzdC55ID0gU29uYXJbLXRyYWluLmluZCwgNjFdCmBgYAoKIyMj44G+44Ga44GvMeWxpOOBp+WLleOBi+OBl+OBpuOBv+OCiwpgYGB7cn0KZGF0YSA8LSBteC5zeW1ib2wuVmFyaWFibGUoImRhdGEiKQpmYzEgPC0gbXguc3ltYm9sLkZ1bGx5Q29ubmVjdGVkKGRhdGEsIG51bV9oaWRkZW49MSkKbHJvIDwtIG14LnN5bWJvbC5Mb2dpc3RpY1JlZ3Jlc3Npb25PdXRwdXQoZmMxLG5hbWU9J2xyJykKCm14LnNldC5zZWVkKDApCm1vZGVsIDwtIG14Lm1vZGVsLkZlZWRGb3J3YXJkLmNyZWF0ZShscm8sIFg9dHJhaW4ueCwgeT10cmFpbi55LAogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgY3R4PW14LmNwdSgpLCBudW0ucm91bmQ9MjAsIGFycmF5LmJhdGNoLnNpemU9MjAsCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBsZWFybmluZy5yYXRlPTAuMDcsIG1vbWVudHVtPTAuOSwgZXZhbC5tZXRyaWM9bXgubWV0cmljLmFjY3VyYWN5KQpgYGAK5YuV44GE44Gf44GMYWNjdXJhY3nkuIrjgYzjgonjgZrjgIIKCiMjI+WkmuWxpOOBquOCie+8nwpgYGB7cn0KZGF0YSA8LSBteC5zeW1ib2wuVmFyaWFibGUoImRhdGEiKQoKZmMxIDwtCW14LnN5bWJvbC5GdWxseUNvbm5lY3RlZChkYXRhLAluYW1lPSJmYzEiLAludW1faGlkZGVuPTEyOCkgCmFjdDEJPC0gbXguc3ltYm9sLkFjdGl2YXRpb24oZmMxLAluYW1lPSJ0YW5oMSIsCWFjdF90eXBlPSJ0YW5oIikgCmRyb3AxCTwtCW14LnN5bWJvbC5Ecm9wb3V0KGFjdDEsCXAgPQkwLjEsCW5hbWU9ImRyb3AxIikgCmZjMgk8LQlteC5zeW1ib2wuRnVsbHlDb25uZWN0ZWQoZHJvcDEsCW5hbWU9ImZjMiIsCW51bV9oaWRkZW49NjQpIAphY3QyCTwtCW14LnN5bWJvbC5BY3RpdmF0aW9uKGZjMiwJbmFtZT0idGFuaDIiLAlhY3RfdHlwZT0idGFuaCIpIApkcm9wMgk8LSBteC5zeW1ib2wuRHJvcG91dChhY3QyLAlwCT0JMC4xLAluYW1lPSJkcm9wMiIpIApmYzMJPC0JbXguc3ltYm9sLkZ1bGx5Q29ubmVjdGVkKGRyb3AyLCBuYW1lPSJmYzMiLAludW1faGlkZGVuPTEpCgpscm8yPC0gbXguc3ltYm9sLkxvZ2lzdGljUmVncmVzc2lvbk91dHB1dChmYzMpCgpteC5zZXQuc2VlZCgwKQptb2RlbCA8LSBteC5tb2RlbC5GZWVkRm9yd2FyZC5jcmVhdGUobHJvMiwgWD10cmFpbi54LCB5PXRyYWluLnksCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBjdHg9bXguY3B1KCksIG51bS5yb3VuZD0yMCwgYXJyYXkuYmF0Y2guc2l6ZT0yMCwKICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIGxlYXJuaW5nLnJhdGU9MC4wNywgbW9tZW50dW09MC45LCBldmFsLm1ldHJpYz1teC5tZXRyaWMuYWNjdXJhY3kpCgpgYGAK5LiK5omL44GP5Zue44KJ44Gq44GE44CCCgojIyNteC5tbHDjgYvjgolvdXRfYWN0aXZhdGlvbj0ibG9naXN0aWMi44KS5ZG844KT44Gn44G/44KLCmBgYHtyfQpteC5zZXQuc2VlZCgwKQptb2RlbCA8LSBteC5tbHAodHJhaW4ueCwgdHJhaW4ueSwgaGlkZGVuX25vZGU9MTAsIG91dF9ub2RlPTEsIG91dF9hY3RpdmF0aW9uPSJsb2dpc3RpYyIsCiAgICAgICAgICAgICAgICBudW0ucm91bmQ9MjAsIGFycmF5LmJhdGNoLnNpemU9MTUsIGxlYXJuaW5nLnJhdGU9MC4wNywgbW9tZW50dW09MC45LCAKICAgICAgICAgICAgICAgIGV2YWwubWV0cmljPW14Lm1ldHJpYy5hY2N1cmFjeSkKYGBgCuOBk+OBruaWueazleOBp+OCguWFqOeEtuOBoOOCgeOAggoKIyMjbXgubWxw44GL44KJb3V0X2FjdGl2YXRpb249InNvZnRtYXgi44KS5ZG844KT44Gn44G/44KLCmBgYHtyfQpteC5zZXQuc2VlZCgwKQptb2RlbCA8LSBteC5tbHAodHJhaW4ueCwgdHJhaW4ueSwgaGlkZGVuX25vZGU9MTAsIG91dF9ub2RlPTIsIG91dF9hY3RpdmF0aW9uPSJzb2Z0bWF4IiwKICAgICAgICAgICAgICAgIG51bS5yb3VuZD0yMCwgYXJyYXkuYmF0Y2guc2l6ZT0xNSwgbGVhcm5pbmcucmF0ZT0wLjA3LCBtb21lbnR1bT0wLjksIAogICAgICAgICAgICAgICAgZXZhbC5tZXRyaWM9bXgubWV0cmljLmFjY3VyYWN5KQpgYGAKc29mdG1heOOBquOCieOBhuOBvuOBj+OBhOOBj+OAgeisjuOAgiAgCgroibLjgIXjgoTjgaPjgabjgb/jgZ/jgYzjgaDjgoHjgIIgIAoib3V0X25vZGUi44Go44GLIm51bV9oaWRkZW4i44Go44GLMeS7peWkluOBq+OBl+OBn+OCieWLleOBi+OBquOBhOOBl+WFqOeEtuOCj+OBi+OCieOCk+OAgiAgCltXZWlyZCBMb2dpc3RpY1JlZ3Jlc3Npb25PdXRwdXQgQnVnXShodHRwczovL2dpdGh1Yi5jb20vZG1sYy9teG5ldC9pc3N1ZXMvMTk3NSnjgavjgoJudW1faGlkZGVu44GvMeOBq+OBl+OCjeOBqOOBguOBo+OBn+OBruOBp+mWk+mBleOBhOOBp+OBr+OBquOBhOOBqOaAneOBhuOBjOKApuOAgiAgCnRyYWlu44Gu44Go44GT44KN44KSZmFjdG9y44Gr44GX44Gm44G/44Gf44KK44KC44GX44Gf44GMYWNjdXJhcnnjgYww44Gr44Gq44Gj44Gm6I2J44GM55Sf44GI44Gf44CCICAK57WQ5bGA44GC44KT44G+44KK5b2544Gr56uL44Gf44Gq44GE44G+44Go44KB44Gr44Gq44Gj44Gm44GX44G+44GE44G+44GX44Gf44CC44GZ44GE44G+44Gb44KT44CCCgojIyMyMDE2MDYwMei/veiomCAgCmh0dHBzOi8vdHdpdHRlci5jb20vVEpPX2RhdGFzY2kvc3RhdHVzLzczNzY5NTE0MTY0NTgwMzUyMCAgCmV2YWxfbWV0cmlj44Gr5piO56S655qE44GrbXguTVNFKCnjgpLkuI7jgYjjgabjgoTjgovjgajop6PmsbrjgZnjgovjgajjgYTjgYboqbHjgpJUSk/jgZXjgpPjgYzopovjgaTjgZHjgabjgY/jgaDjgZXjgaPjgZ/jga7jgafoqabjgZfjgabjgb/jgb7jgZnjgIIgIApgYGB7cn0KZGF0YSA8LSBteC5zeW1ib2wuVmFyaWFibGUoImRhdGEiKQpmYzEgPC0gbXguc3ltYm9sLkZ1bGx5Q29ubmVjdGVkKGRhdGEsIG51bV9oaWRkZW49MSkKbHJvIDwtIG14LnN5bWJvbC5Mb2dpc3RpY1JlZ3Jlc3Npb25PdXRwdXQoZmMxLG5hbWU9J2xyJykKCm14LnNldC5zZWVkKDApCm1vZGVsIDwtIG14Lm1vZGVsLkZlZWRGb3J3YXJkLmNyZWF0ZShscm8sIFg9dHJhaW4ueCwgeT10cmFpbi55LAogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgY3R4PW14LmNwdSgpLCBudW0ucm91bmQ9MjAsIGFycmF5LmJhdGNoLnNpemU9MjAsCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICBsZWFybmluZy5yYXRlPTAuMDcsIG1vbWVudHVtPTAuOSwgZXZhbC5tZXRyaWMgPSBteC5tZXRyaWMucm1zZSkKYGBgClLjga7loLTlkIjjgaDjgahldmFsLm1ldHJpYyA9IG14Lm1ldHJpYy5ybXNl44Gn6KGM44GR44KL44G/44Gf44GE44Gn44GZ44Gt44CCICAK5YuJ5by344Gr44Gq44KK44G+44GX44Gf44CC44GC44KK44GM44Go44GG44GU44GW44GE44G+44GZ44CCCgoK5Y+C6ICDICAKW05ldXJhbCBOZXR3b3JrIHdpdGggTVhOZXQgaW4gRml2ZSBNaW51dGVzXShodHRwOi8vbXhuZXQtdHFjaGVuLnJlYWR0aGVkb2NzLmlvL2VuL2xhdGVzdC9wYWNrYWdlcy9yL2ZpdmVNaW51dGVzTmV1cmFsTmV0d29yay5odG1sKSAgCltXZWlyZCBMb2dpc3RpY1JlZ3Jlc3Npb25PdXRwdXQgQnVnXShodHRwczovL2dpdGh1Yi5jb20vZG1sYy9teG5ldC9pc3N1ZXMvMTk3NSkgIApbTm8gbGVhcm5pbmcgdXNpbmcgTG9naXN0aWNSZWdyZXNzaW9uT3V0cHV0LiBNaXN0YWtlbiBuZXQgZGVmaW5pdGlvbj9dKGh0dHBzOi8vZ2l0aHViLmNvbS9kbWxjL01YTmV0LmpsL2lzc3Vlcy82NykKCg==