課題:Jリーグにおけるホームチームの勝率の推定

文学部棟 L510, tell 0757532446

2026-04-04

ホームチーム・アドバンテージ

  • スポーツでは、ホームチーム(以下、ホーム)のほうがアウェイのチーム(以下、アウェイ)より有利と言われる。理由として以下のような要因が (Courneya and Carron (1992) の 整理を 安部 (2017), 原田 et al. (1996) より孫引き)
  1. 習熟要因: ホームのほうが芝の状態、風の吹き方など、試合会場の状態に習熟している
  1. 移動要因:アウェイは試合直前に長距離移動するので、コンディション維持がホームより難しい
  2. ルール要因:スポーツによっては「ホームが後攻」のように、ルールによってホームとアウェイで条件が異なる
  3. 観客要因:観客の大半はホームを応援するので、ホームのほうが鼓舞されやすく、審判もホームに有利な判定をしやすくなる

背景:文化や時代による差

  • 欧米の研究では、ホームチーム・アドバンテージがあるという説が一般的であるが、ホームチームアドバンテージは、文化や時代によって異なる (Richard Pollard and Gómez 2017)。e.g 「中東の笛
  • また出版バイアスの恐れも (池田 and 平石 2016)
  • Jリーグのデータでどの程度ホームチームアドバンテージがあると言えるか、検証してみよう。
  • 将来的には観客数や時代による違いなど検討するとおもしろい結果が得られるかも?

課題

Jリーグのホームページ に行き、指定された年度の勝敗データを入手して、ホームの勝率とアウェイの勝率を比較しなさい。ただし、以下の要領に従うこと

担当する大会の種類・年度の決定

  • =RANDBETWEEN(1, 20) とすると、1~20 のあいだの整数のうちどれかが等確率で返されるので、最初に返された数値に対応する大会の種類・年度(下の表を参照)の試合を担当する
返された整数 担当する大会の種類・年度
1 J1リーグ 1993~1997
2  〃   1998~2002
3  〃   2003~2007
4  〃   2008~2011
5  〃   2012~2015
6  〃   2016~2019
7  〃   2020~2023
8 JリーグYBCルヴァンカップ  1992~2008
9  〃     2009~2024
10 J2リーグ 1998~2004
11  〃   2005~2008
12  〃   2009~2011
13  〃   2012~2014
14  〃   2015~2017
15  〃   2018~2020
16  〃   2021~2023
17 J3リーグ 2014~2017
18  〃   2018~2021
19  〃   2021~2024
  1. 明治安田Jリーグワールドチャレンジ、明治安田生命チャンピオンシップ J1・J2入れ替え戦、J1参入プレーオフ、J1参入決定戦、J1昇格プレーオフ J2・JFL入れ替え戦、J2・J3入れ替え戦、J2昇格プレーオフ、J3・JFL入れ替え戦、Jユースリーグ、Jユースカップ

検索とコピペ

  • Jリーグのホームページ に行き、担当する大会の種類、年度の試合結果を検索する
  • しばしば 1000行以上の結果が表示されるが、結果の部分をすべて Google Spreadsheet にコピペ
  • 普通に貼り付けるときれいに表の形にならないので、「右クリック」「特殊貼り付け」「値のみ貼り付け」するか、Ctrl + Shivt + V 。

データの整形

  1. 試合結果の無い行は削除(中止など)
  2. 「インターネット放送・中継」の行に、まれに「*H&A入替」といった記載がある。これはホームがなぜかアウェイの欄に、アウェイがホームの欄に記載されている場合である。その場合、ホームとアウェイの名前を入れ替え、点数も入れ替える
  • 国立競技場(国立)は、京都パープルサンガのように東京から遠く離れた場所に本拠のあるチームが「ホーム」として試合することがあるので、データから除外(2019年12月に開業)
  • ホームとアウェイの点数が同じ「スコア」のセル内に “1-2” のように記載されているので、これらを以下の要領で別の列に分割する
    • 「スコア」の列と「アウェイ」の列のあいだに1行挿入
    • 「スコア」の列を選択し、メニューから「データ」「テキストを列に分割」を選択
    • 「区切り文字」から「カスタム」を選び、“-” を入力
    • 二つの列の名称を「ホーム点数」、「アウェイ点数」に変更

得失点差の計算と度数分布表の作成

  • 一番右の列にホームの点数からアウェイの点数を引いた値を計算
  • データとは別のシートに、以下の要領で得失点差の度数分布表を作る
    • まず得失点差の最大値と最小値を計算 =max(データ), =min(データ)
    • 最小値から最大値まで、すべての得失点差の度数を表にまとめる =countif() または =frequency() でできる

ホームの勝率と 95% 信頼区間の計算

  • ホームが勝った試合数 \(h\)、負けた試合数 \(a\) を計算し、\(h/(h+a)\) を計算
  • 上の計算は引き分けをデータから除外している点に注意
  • 95% 信頼区間を計算
  • 95% 信頼区間の下限値が 0.5 よりも大きければ、ホームのほうが有利と判断できる

まとめと考察

  • 担当した大会の種類と年度、得失点差の度数分布表、ホームの勝ち試合数と負け試合数、ホームの勝率、標準偏差の推定値、標準誤差、95%信頼区間を一つのシートにきれいにまとめる
  • 結果を文で簡単に述べ、どうしてそのような結果になったのか、自分なりのアイディアを簡単に述べよ。その他、このデータや分析法の限界について思うところがあればそれも書く。

文献

Courneya, Kerry S., and Albert V. Carron. 1992. “The Home Advantage in Sport Competitions: A Literature Review.” Journal of Sport & Exercise Psychology 14(1).
Richard Pollard, Jaime Prieto, and Miguel-Ángel Gómez. 2017. “Global Differences in Home Advantage by Country, Sport and Sex.” International Journal of Performance Analysis in Sport 17(4):586–99. doi:10.1080/24748668.2017.1372164.
原田尚幸, 守能信次, 原田宗彦, and 菊池秀夫. 1996. “ホームアドバンテージ (Home Advantage) と観衆要因に関する研究.” 『中京大学体育学論叢』 38.
安部健太. 2017. “観客の有無によるホームアドバンテージへの影響: サッカーの無観客試合を手掛かりに.” 『対人社会心理学研究』 17:53–60.
池田功毅, and 平石界. 2016. “心理学における再現可能性危機:問題の構造と解決策.” 『心理学評論』 59(1):3–14. doi:10.24602/sjpr.59.1_3.