Data Science by R and Python

統計学を、広く、深く、わかりやすく。

【セミナー情報】スポーツ統計学の講座に登壇します

f:id:tomoshige_n:20140708221341j:plain

スポーツデータアナリティクス基礎講座

今回は、スポーツ統計学についてセミナーでお話をさせていただくことになりました。こちらにも案内と簡単な内容を書かせていただきます。

概要(スポーツ統計学とは)

スポーツ統計学はデータ主導型マネージメントによって、チームを勝利に導いたり、現場での意思決定を適切に行うためのツールとして注目を集めています。皆さんに理解していただきやすいイメージとしては、映画「マネーボール」がその一例と言えます。「マネーボール」は野球に関するデータ解析ですが、一方でそれ以外の分野でも統計学は用いられ、サッカーにおいても各チームの戦力を数値化することが行われたりしています。実際に、アメリカでは野球の能力評価の指標として様々な指標が用いられており、野球が様々な観点から分析されています(おそらく日本よりもそれらの指標が一般に認知されています)。

今回は、前年度私たちの慶應義塾大学理工学部の南研究室(統計)で行った「野球データの解析」に関する手法について説明させていただく機会を頂きましたので、登壇をさせていただくことになりました。

解析の内容について

今回の解析の内容は「データスタジアム提供プロ野球記録データに基づくバント効果の推定」です。バントは日本の野球において非常によく取られる戦略の1つです。1つアウトを与えても、ランナーを得点圏に進めることを目的として行われる戦術です。この方法は、合理的に思われていますが、データ解析の視点から果たして本当に「意味がある」と言えるのかどうかを私たちは2010年度 ~ 2012年度のプロ野球のデータから解析しました。
バントの戦術を取ることに、本当に意味があるのであれば、バントをした方が、バントをしなかった場合と比較して得点期待値、得点する確率が高くなるということがデータから明らかになるはずであるという立場に立って解析を行っています。

具体的な手法としては、「傾向スコア」や「スプライン回帰法」などを用いて解析を行っています。今回はこれらの手法について説明させていただくとともに、実際の野球データの解析にどのように役立つのかという視点についてお話しさせていただきます。

僕がお話しすること

僕は、傾向スコア法ではなく、一般化加法モデル(GAM)や、ブートストラップ法、疑似ポアソン回帰などをお話しする予定です。スライドについてはここで公開する予定です。

イベント詳細

・第1回 スポーツデータアナリティクス基礎講座
・日時:2014年7月27日(日)
・会場立教大学・本館1202教室(JR池袋駅より徒歩6分)
・主催:日本統計学会統計教育分科会, 同学会スポーツ統計分科会

[プログラム]
講演:1時30分~2時40分

傾向スコアを適用した因果効果の検証
データスタジアム提供プロ野球記録データに基づくバント効果の推定~

中村知繁(慶應義塾大学大学院 理工学研究科修士課程1年)
小河有史(慶應義塾大学理工学部 数理科学科4年)

質疑: 2時40分~3時
ーーーーーーーーーーーーーーーーーーーーーー
講演の内容は、前年度のコンペティションにおいて行った
野球におけるバント効果の解析の内容に沿って説明いたします。
具体的には、以下の項目についてお話しいたします。
*「欠測」の考え方
*傾向スコアの考え方
*傾向スコアの計算(ロジスティック回帰モデル)
*IPW法
*ダブルロバスト推定法
ポアソン回帰モデル、疑似ポアソン回帰モデル
*平滑化スプライン法(信頼曲線←線形混合モデル)
*ブートストラップ法
の解説
ーーーーーーーーーーーーーーーーーーーーーーーーーーー
*本研究会終了後、3時より、本年度のスポーツデータ解析コンペの提供データ等の説明会が行われます。

申し込み

7月27日 第1回 スポーツデータアナリティクス基礎講座
※かなり席が埋まっているようなのでお急ぎくださいとのことです。