僕が統計を勉強するのに使ってる本まとめ(14/12/06更新)
統計を勉強し始めて3年ぐらいになりましたが、その3年間で「あー、これ何度も見直してるな」的な本をまとめておこうと思い立ったのが午後4時ぐらいなのですが、せっかくの機会なので、書いてみようと思います。ただ、とにかく本を読むのが苦手な僕なので、レパートリーに限りがありまして「偏ってる」のは間違いありません。
それから、数理科学をやってる人の本棚です(それ数学的にどうなん?とか気になっちゃうような人が書いてます)。数式見て、無理そうですという人は、あまり参考にされない方が良いかと思います。そういう方向けには、いろんな方がオススメの本のブログなどを書いているのでそちらを参考にされるのがいいかと。。。※あと、以下のAmazonリンクから購入していただいても、僕には1円も入りません(笑)。
数理統計学全般
Statistical Inference
- 作者: G.C. Casella,Roger L. Berger
- 出版社/メーカー: Brooks/Cole
- 発売日: 2008/06/07
- メディア: ペーパーバック
- 購入: 1人 クリック: 1回
- この商品を含むブログを見る
とっても重宝する統計学の教科書的立ち位置なのがこの本です。統計学で扱う「集合」の話から始めて、「分布」とは何か、「統計的検定」などなど、たくさん載っていて、数理統計の基本でつまづいたときに必ず見直す1冊です。
入門・演習 数理統計
- 作者: 野田一雄,宮岡悦良
- 出版社/メーカー: 共立出版
- 発売日: 1990/05
- メディア: 単行本
- クリック: 4回
- この商品を含むブログ (2件) を見る
こちらは和書です。上のものよりも、ちょっと分量が少ないですが、こちらも数理統計を勉強する上で重宝する一冊。
統計学のための数学入門30講
- 作者: 永田靖
- 出版社/メーカー: 朝倉書店
- 発売日: 2005/04/01
- メディア: 単行本
- 購入: 23人 クリック: 398回
- この商品を含むブログ (24件) を見る
統計学を勉強する前に、抑えておきたい数学の知識を整理している1冊です。といいつつ、僕も基礎が抜けててよくこの本に立ち戻ります。特に、行列計算などの基本的な部分や、逆行列の存在条件など、案外忘れてしまった知識を取り戻すのに役立ちます。
bayesian inference in statistical Analysis
Bayesian Inference in Statistical Analysis (Wiley Classics Library)
- 作者: George E. P. Box,George C. Tiao
- 出版社/メーカー: WILEY
- 発売日: 1992/03
- メディア: ペーパーバック
- この商品を含むブログを見る
ベイジアンモデリングなどをしていると、あまり数式が出てこなかったりして、計算が複雑なので結果だけ示されることがありますが、どうしても気持ち悪いとか、自分で導出したいぞ!という人向けの1冊です。事前分布・事後分布などの概念をそこそこ知ってないと手を出せないと思いますが、読めるようになれば楽しい1冊なんじゃないかなと。僕は好きです。
モデリング系
多変量解析概論
- 作者: 塩谷実
- 出版社/メーカー: 朝倉書店
- 発売日: 1990/03
- メディア: ハードカバー
- この商品を含むブログを見る
1990年に出版された本ですが、多変量解析の基本的な部分に立ち戻るのに重宝している1冊です。線形回帰モデルとは何かを数式と図を用いて丁寧に説明してくれますし、決定係数とは何かなど基本的なものをきちんと定義してくれています。
一般化線形モデル入門
- 作者: Annette J.Dobson,田中豊,森川敏彦,山中竹春,冨田誠
- 出版社/メーカー: 共立出版
- 発売日: 2008/09/08
- メディア: 単行本
- 購入: 15人 クリック: 152回
- この商品を含むブログ (13件) を見る
一般化線形モデルについて書かれた比較的読みやすい1冊かなと思っています。一般化線形モデルについては、有名なものとして久保先生の書かれている「データ解析のための統計モデリング入門」もあります(勉強会も開かれているほど、有名な1冊です)。ただ、僕は緑本は、もうちょっと数学的に書いてほしい。。。ということもあり、こちらの方をオススメします。
Generalized Linear Model, Second Edition
- 作者: P. McCullagh,John A. Nelder
- 出版社/メーカー: Chapman and Hall/CRC
- 発売日: 1989/08/01
- メディア: ハードカバー
- クリック: 47回
- この商品を含むブログ (4件) を見る
一般化線形モデルを提案したNelderが共著者になっている本です。僕もまだこの本全体を理解できていませんが、一般化線形モデルをかなり深くまで掘り下げて書かれている1冊です。ただ、結構わかりにくい気はしています。
Generalized Additive Models: An Introduction with R
- 作者: Simon Wood
- 出版社/メーカー: Chapman and Hall/CRC
- 発売日: 2006/02/27
- メディア: ハードカバー
- クリック: 17回
- この商品を含むブログ (8件) を見る
一般化加法モデル(一般化線形モデルに対して、スプラインを使って拡張する)についての本です。ここまでくると、かなり柔軟なモデリングが可能になります。一般化線形モデルはある程度わかっていないと読めないかもしれません。。。過去に、野球データ解析の際に用いています(下のスライドの後半を参照していただければ)。
20140727_第1回スポーツデータアナリティクス基礎講座
機械学習
The Elements of Statistical Learning
- 作者: Trevor Hastie,Robert Tibshirani,Jerome Friedman
- 出版社/メーカー: Springer
- 発売日: 2009/03
- メディア: ハードカバー
- 購入: 1人 クリック: 222回
- この商品を含むブログ (14件) を見る
入門パターン認識と機械学習
- 作者: 後藤正幸,小林学
- 出版社/メーカー: コロナ社
- 発売日: 2014/03/30
- メディア: 単行本
- この商品を含むブログ (5件) を見る
機械学習を数学やってる人が入門するのに結構いい本だと思いました。PRMLは個人的に読みにくいなーと思っていましたが、こっちは読みやすかったです。
Python, Rで分析・解析
Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理
Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理
- 作者: Wes McKinney,小林儀匡,鈴木宏尚,瀬戸山雅人,滝口開資,野上大介
- 出版社/メーカー: オライリージャパン
- 発売日: 2013/12/26
- メディア: 大型本
- この商品を含むブログ (6件) を見る
Pythonでデータ処理のやり方を覚えるのにまず最初にやった1冊です。この本で、大体の基本的なことを学びました。今でも見直して、「あー、そうだったそうだった」と想い出すのに使ってます。
集合知プログラミング
- 作者: Toby Segaran,當山仁健,鴨澤眞夫
- 出版社/メーカー: オライリージャパン
- 発売日: 2008/07/25
- メディア: 大型本
- 購入: 91人 クリック: 2,220回
- この商品を含むブログ (277件) を見る
Pythonで機械学習するなら、持っておいた方がいいかなと思う1冊です。とにかく、話題が豊富で、機械学習に興味のある人なら、どこかの章がひっかかるんじゃないかなと。
入門機械学習
- 作者: Drew Conway,John Myles White,萩原正人,奥野陽,水野貴明,木下哲也
- 出版社/メーカー: オライリージャパン
- 発売日: 2012/12/22
- メディア: 大型本
- 購入: 2人 クリック: 41回
- この商品を含むブログ (11件) を見る
とりあえず、機械学習をRでやってみたいというのであれば、この本が参考になりました。ただ、Rで学ぶデータサイエンスシリーズというのもありまして、こちらの方が好きな方もいらっしゃるようです。
Rで学ぶデータサイエンス(シリーズものです20巻ぐらいあるんじゃないかな)
- 作者: 藤井良宜,金明哲
- 出版社/メーカー: 共立出版
- 発売日: 2010/04/22
- メディア: 単行本
- クリック: 13回
- この商品を含むブログ (3件) を見る
こちらはシリーズ物で、Rで様々なデータ解析をやってみようというコンセプトのもとつくられているので、手を動かしながら解析を行っていくことができます。
まとめ
これは、完全に僕の本棚的なものなので、参考になるかどうかわかりませんが、参考になった方がいらっしゃれば幸いです。