2014/06/14 Sat (Rev. 2014/07/10)

概要

  • オンライン学習アルゴリズムのパラメータ更新の可視化
  • Passive-AggressiveとAROWの実装(PAよりもAROWの選択を推奨)
  • 使用データセットはkernlabのspam
  • ggvisで可視化
  • ShinyでWebアプリ化
     https://yamano357.shinyapps.io/OnlineLearning/
     (「Plot coefficient」を選択。とても時間がかかります)

自己紹介

  • Twitter: @yamano357
  • Background: Natural Language Processing
  • Summarization, Machine Learning
  • Task: PDMP, Optimization, Visualization, Analytics
  • GitHub: https://github.com/yamano357/
  • Blog: Coming Soon…

オンライン学習って?

『データは一つずつ逐次的に与えられ,データが与えられるたびにパラメータを更新する』 (朱鷺の杜Wikiの『逐次学習』より)

オンライン学習アルゴリズムの実装例

まとめ

  • (Crammer's) オンライン学習アルゴリズムのパラメータ更新過程を可視化
  • データをシャッフルさせると、一度では収束しそうにないことが明確に
     実行速度が遅いのでRcppで書いたコードもあるが、まだ公開していない
  • ShinyだけでLTも可能(fluid page layoutをデザインとして使用)
     スライドにShinyアプリを埋め込めるようになったので、そっちを使った方がいい