Takeshi Sugiyama
2015/12/05
杉山 剛(@soogie すーぎー)
というのは今日の話とは無関係で…
2002年から2012年のNFLのすべてのプレーを集めたデータ (https://github.com/veltman/nflplays)
nfl <- fread("data/nflplays.csv", data.table = FALSE)
何回目の攻撃でどんなプレーをしているか
RUNorPASS
DOWN RUN PASS PUNT
1 75774 65896 3
2 49813 57520 3
3 16404 49500 13
4 1939 2770 26292
※ プレーの種類はもっと多様ですが単純化しています
ランかパスかの2者択一というふうに単純化して,ロジスティック回帰を試みます。
Call: glm(formula = RUNorPASS ~ DOWN + YARDS_TO_FIRST, family = binomial(link = "logit"),
data = nfl_RorP)
Coefficients:
(Intercept) DOWN YARDS_TO_FIRST
-2.0913 0.7328 0.1183
Degrees of Freedom: 319615 Total (i.e. Null); 319613 Residual
Null Deviance: 439900
Residual Deviance: 416000 AIC: 416000
ロジスティック回帰の結果より
\[ パスの確率 = \frac{1}{1+e^(-2.09 + 0.73 ダウン + 0.12 残りヤード)} \]
ファーストダウン残り10ヤードのときは 46パーセント
→ ほぼ五分五分。ややラン
セカンドダウン残り2ヤードのときは40パーセント
→ パスよりはランで確実に
サードダウン残り18ヤードのときは91パーセント
→ ランでは無理。パスで起死回生
せっかくなので,第何クオーター(QTR)か,敵との点差(DIFF)も加味して決定木を作ってみます。
勝っているときの第1,2ダウンはランを選びがち。第3ダウンは残り1.5ヤード以上ならパスのようです。
パスを選択しがち
ランを選択しがち
シアトルシーホークスのラッセル・ウィルソンのようにパスがうまくて,自分が走っても速い,手に負えないQBもいます。
パスが得意なQBアレックス・スミスが活躍していた頃です。パスが多めですね
当時はラッセル・ウィルソンはいませんでしたがランの比率が高いのは「ビースト」として知られるランニングバック,マーショーン・リンチのおかげでしょう
次のプレーを予測しながら見ると,アメフト観戦がめちゃめちゃ楽しくなるよ!
このプレゼンのファイルと実際に動くRプログラムはこちら
https://github.com/soogie/NFLdata4Fun
です