Data Science by R and Python

統計学を、広く、深く、わかりやすく。

夏休み!にやりたいこと!

夏休み

遂に、夏休みまで後2日になりました。夏休みというのは、名ばかりなわけですが。でも、時間があるのは確かなので、読んでみたい本とか、勉強・研究してみたい内容とか、まとめてみようと思います。まず、勉強・研究したい内容から。

勉強したい・研究したい分野

状態空間モデル

  • State Space Time Series Analysis(邦訳:状態空間時系列分析入門)

一般化加法モデル + スプライン平滑化法

  • Generalized Additive Models: An Introduction with R (Simon Wood 2006)

ニューラルネットワークSVM・RKHS

  • Pattern Recognition and Machine Learning

Sparse Data Analysis

  • マーケティングデータなどのスパースなデータを分析するための手法の研究。

メタアナリシス

  • 研究データの統合のお話だけど、これから大事な領域だと思ってるところ。

医療・健康データ解析の事例検索

  • 世界で行われてるヘルスケアデータを解析している事例の調査かな。

挑戦してみたいこと

Kaggle

  • データ解析のコンペティションが開催されている世界的なプラットフォーム.課題1つには応募してみたいと思っています。ちなみに、一番ハードルが高いコンテスト。

第2回データビジネス創造コンテスト(SFC Dig)

  • SFCアクセンチュアが開催するオープンデータに基づくコンテスト。8/17(日)が締切。応募する予定です。一緒に応募してみたい人を募集しています。

第2回データビジネス創造コンテスト | 慶應義塾大学 × アクセンチュア

学生データサイエンティスト日本一決定戦

  • 楽しそうなので、遊び感覚で参加してみたいイベント!予選もあるらしく、8月20日12:00〜9月18日24:00が予選期間とのこと。まずは、予選通過を目指そうと思います!

学生データサイエンティスト日本一決定戦 Data League <予選> | クラソル | CrowdSolving

Pythonを本格的にデータ解析に使い始める

  • そろそろ、Rだけだとつまんないので、Pythonでデータの解析ができるようになりたいなと。めんどくさいらしいけど...文字列操作とかはやっぱりRよりPythonだろうと。とりあえず、環境設定からかな。実装するなら「Naive Bayes Method」かなと思います。

データ解析系の新しいイベントの枠組み

  • 日本って、長期間(2ヶ月)とかのイベントがやっぱり多いので、そうじゃなくてもっと気軽に参加できるデータ解析の3日間のコンペティションとかつくってみたいなという想いがあるので、企画を開始したいなという妄想。

読みたい本

ユーザーイリュージョン -意識という幻想-

  • これは見つけたときにめっちゃワクワクした本!読んでみたい。

Creative Confidence

  • 流し読みしたい本.

新書を2,3冊ぐらい(とりあえず教養系の本が読みたい)

  • 世界を変えた10冊の本
  • 知らないと恥をかく世界の大問題5どうする世界のリーダー?~新たな東西冷戦~
  • その他、もろもろ

書いてみて

できないぐらい多いことに気づいているので、どうしようか....
とりあえず、帰省してる期間は人に会いつつ、基本的には本読むしかない。
10月の段階でどれだけ達成できてるかな...