実験スピリッツ

経済・市場・思想の陰謀論をまとめます(ネタ要素強め)

スポンサーリンク

【サッカー】ポアソン分布を使ってtoto予想してみた。

f:id:yw555201:20150927004024j:plain

あらゆるスポーツはデータ分析によって評価されています。今回はサッカーです。

調べてみた結果、試合のゴール数はポアソン分布(正規分布)に従うと仮定できるそうで、簡単そうなのでやってみます。

※かなり前に実験してみた結果なので、その辺はご容赦下さい。

ポアソン分布とは

ポアソン分布は平均値を変数として使用することで、ある事象が起こる確率を求めることができます。

f:id:yw555201:20150927005738p:plain

今回の場合、λに平均得点、kに得点の0点~3点を代入します。

例えば、2015年サンフレッチェ広島は1ゲームあたり平均2.03ゴールを得点する可能性があります。この情報をポアソン方程式に当てはめると、広島が試合で0ゴールになる確率は13%、1ゴールは27%、2ゴールは27%、3ゴールは18%になります。簡単ですね。

しかしながら、サッカーは対戦相手あってのものです。単純に、これをそのまま利用するのは適切ではありません。

検証する対象試合

今回は第798回2015年10月3日開催のtotoGOAL3を予想してみました。totoGOAL3は指定された3試合の各チームのゴール数を予想するゲームです。

今回の指定試合は以下の通りです。

f:id:yw555201:20150927010709p:plain

これは松本山雅VS清水エスパルスの試合が拮抗しそうです。分析していた時点で、両チームともJ1残留争いで負けられない熾烈な戦いが予想されます。これはむずかしい。

検証方法

今回は、サッカーのデータ分析で最低限考慮すべき「攻撃力」「防御力」「ホームアウェイの影響」を予想に使用します。使用するデータは今シーズンJ1で行われた130試合とします。

攻撃力と防御力の計算

攻撃力と防御力を計算する第一歩は、J1リーグ全ての試合でホームチームおよび アウェイチームが獲得した平均ゴールを計算することです。

  • ホームチーム:1.398点
  • アウェイチーム:1.272点

アウェイの方が得点を取りづらくなることが分かります。

同様に各チームのホームゲーム、アウェイゲームあたりに獲得した平均ゴール数奪われた平均ゴール数を求めます。

  • ホームで獲得したゴール数 / 試合数
  • アウェイで獲得したゴール数 / 試合数
  • ホームで奪われたゴール数 / 試合数
  • アウェイで奪われたゴール数 / 試合数

以上箇条書きで上げた変数を使用して攻撃力と防御力を求めます。

具体的にホーム仙台VS横浜アウェイの試合で計算してみます。

仙台攻撃力の計算

  1. ホームで獲得したゴール数 / 試合数
  2. この値をホームチームの平均得点1.398点で割ります。

横浜FMの防御力の計算

  1. アウェイで奪われたゴール数 / 試合数
  2. この値をアウェイチームの奪われた平均得点1.398点で割ります。(※ホームチームの平均得点=アウェイチームの奪われた平均得点)

仙台の予想ゴール数

これで以下の式を使用して、予想ゴール数を計算できます。

仙台の予想ゴール数 = 仙台の攻撃力 x 横浜の防御力 x J1ホームチームの平均ゴール数

 結果として、ホームチームの仙台の予想得点は1.335点だとはじき出されました。

同様にその他のチームの予想結果は以下のようになります。攻撃力は高い値ほど、防御力は低い値ほどチームが強いことを示しています。

f:id:yw555201:20150927014958p:plain

この得られた予想ゴール数をポアソン分布に利用します。その結果、各チームの得点の確率が求められました。

f:id:yw555201:20150927015709p:plain

出ました。赤字が最も高い確率で起こるであろうゴール数です。予想が難しそうだった松本山雅VS清水エスパルスですが、1対0か1対1が濃厚ですね。鹿島はなんと3点以上の確率が28.9%!?確かに戦力差はあるので分からなくもありません。しかし、波乱が起こるからスポーツが面白いのも事実。なんとも。なんだこれ。

なんか微妙じゃない!?

以下、参考文献です。

サッカー データ革命 ロングボールは時代遅れか

サッカー データ革命 ロングボールは時代遅れか

 

実際に買ってみた。

totoはコンビニのチケット発券機でレシートを打ち出ししてレジで精算するだけですから簡単に買えました。

f:id:yw555201:20151005122240j:plain

しかし、あれだけ予想に時間をかけたにも関わらず、

f:id:yw555201:20151005122519j:plain

非常に小さな勝負になってしまいました。すみません、全く自分の予想が信じられませんでした。

いやいや、

f:id:yw555201:20151005122943j:plain

こんなことを言う人もいますから、100円でも勝負は勝負です。はい。

観戦してみた。

普段サッカーを観戦することも少ない僕ですが、せっかくなのでテレビ観戦して楽しみたいと思います。

指定対象の3試合のうち、仙台VS横浜FM戦だけ午後2時からのキックオフ(他試合は3時から)でしたので、手始めにこの試合を的中させなければなりません。

予想得点は仙台1点。横浜FM1点です。

頼むよ仙台!横浜FM!

キックオフ

さあーどうでしょうか。仙台はホームで有利とは言え、現在最下位争いをしているチームです。上位の横浜に得点を奪えるのでしょうか。

前半33分横浜の三門雄大選手の先制ゴール!仙台にとってはディフェンダーに当たってコースが変化した不運なゴールです。

f:id:yw555201:20151005131859g:plain

圧倒的にボール支配率の高い横浜に先制点を許してしまいました。祈る僕。

しかし、まあ、一点までならオッケーですが、横浜の勢いだとかなり点を取りそうな気配です。祈る僕。

しかし、なんとか仙台も粘ります。祈る僕。

後半7分、仙台奥埜博亮選手の同点ヘディング弾が決まります!祈っていた僕、顔を上げる。

f:id:yw555201:20151005131937g:plain

よっしゃ!

予想通り1対1の展開!!

これはいける気がします!!しかし、あと30分以上の時間があります。またも祈り始める僕。

両チームのゴールキーパー頑張れ…!祈る僕。

そんな中、僕の願いも虚しく横浜の波状攻撃に仙台もろとも夢を打ち砕かれてしまいます。後半19分小林祐三選手がこぼれ球を押し込みゴール。頭を抱える僕。

f:id:yw555201:20151005132745g:plain

後半32分中村俊輔選手のフリーキックゴール。目の焦点が合わなくなってきた僕。

f:id:yw555201:20151005133534g:plain

僕を嘲笑うかのような中村選手のダンスが決まるー。おかしくなって部屋をのたうちまわる僕。

f:id:yw555201:20151005133633g:plain

ゲームセット。結果は仙台1対3横浜でした。大外れです。

ただ、言い訳させて頂くとするなら、仙台はここ5試合複数得点を許しておらず、守備は好調でした。今回はその守備力を上回った横浜の攻撃陣を称えるべきでしょう。というか中村俊輔選手の大暴れでした。

その他の結果はこちらです。

f:id:yw555201:20151005135002p:plain

予想的中率は50%でした。しかしこれは思ったより善戦したのではないでしょうか。ゴール数は約25%以上の確率で起こる結果ばかりです。もう少し購入点数を増やして予想していれば的中させることも不可能ではなかったと思います。

そもそもtotoGOAL3の的中確率は?

各チームには0点~3点以上の4つの選び方があります。それが6チーム分なので4の6乗で4,096通りの買い方があります。つまり、1等当選確率は0.02%。これを1通りの100円掛けで的中させるのはほぼ奇跡と言ってよいでしょう。

しかし、今回の予想では24%以上のものに掛けていれば1等当選金52,991円を獲得出来ていました。

起こる確率が24%以上のものに掛けるならば、僕の予想では2×3×2×2×2×3=144通り(14,400円分)を購入することになり、1等を獲得出来ていました。つまり52,991/14,400=3.67倍になったはずなのです。

なんと思いのほか勝算が立てれる予想であったことが判明しました。データ分析馬鹿になりませんね。

しかし、14,400円をこのゲームにつぎ込む勇気がないのも事実。一般庶民としては投資金額は3分の1から4分の1以下に抑える必要があります。

そうであるならば、データ分析で使用する変数を増やすしかありません。それは今後の研究課題としたいと思います。

分かったのは、サッカーを観戦する楽しさが倍以上になったことです。たった100円でここまでスリルが味わえるなら、お手頃な遊びだと感じました。

来シーズンに再挑戦します。

サッカーの見方が180度変わる データ進化論

サッカーの見方が180度変わる データ進化論