Data Science by R and Python

統計学を、広く、深く、わかりやすく。

【統計の勉強をしよう!】イントロダクション

前回のブログから、少し日にちが空いてしまいました。本日、卒業論文のドラフト提出があったので、先週から部屋と研究室に缶詰になってガシガシ書いていました。無事出せたので、ブログも再開します。

統計学の勉強をはじめるために - このブログで書いていくこと

f:id:tomoshige_n:20140121005806g:plain

さて、前回は統計を勉強するためには「モチベーション」が大事ですねというお話をしました。「どんなことをデータを通して、明らかにしたいのか」を意識しましょうねと。

でも、前回こんなことを書いておきながらですが、統計学に接したことのない、初めての人にとってはハードルが高い課題なのかもしれないと、書いてから思っていました。モチベーションはあるに越したことはないのですが、やはりそもそも統計がどんなシチュエーションで使用されているのかを知って頂くことから始めた方がいいかもしれないと思いました。

そこで、このブログでは統計学を用いてこんなことできるよ。基本的な手法にはこういうものがあるよというのをブログでは紹介していこうと思っています。それを通して、そして読んで頂いてる方のイメージをかき立てる手助けをしたいなと思っています。

ただ、僕が紹介するだけでは、「なるほど」ということで終わってしまうので、自分で同じような解析をするためにはどうすればいいのかまで、ご紹介しようと思います。それから関連する本も紹介しようと思います。

また、統計学には専門的な言葉も数多く登場します。僕もできる限り、それらの言葉が出てきたら説明をしながら前に進めていこうと思いますので、ついてきて頂ければと思います。

そして、次の項目には「始めよう!」と思っている人に、これだけは分かっておいて欲しい「心構え」があるので書かせてもらいます。

 

統計学を始める前の心構え!

f:id:tomoshige_n:20140117024147j:plain

統計学の勉強を始める前には心構えが必要です。その2つをここで整理しておきましょう。とにかく、下の2つに対して「仕方ないよね」ということを頭の片隅で前提に置いてください。

統計学は「数字」を扱う学問であるということ

統計学と聞くと、グラフを読むことのようなイメージがありますが、それはあくまで「一部」です。統計学とは、データを図示することだけではありません。むしろ、その大半が「数学」の考え方によって成り立っています。なので、統計学をやるためには「数学」は避けては通れません。小難しい証明などは、このブログでもガシガシ割愛しますが、全く使わないわけにはいきません。ただ、仮に数学を使ってもできるだけ平易な表現で書くことを意識するようにします。

データを解析する際には「計算」をするということ

統計学は座学ではありません。理論と実践の両側面が重要です。そして、とにかく実際のデータの解析では計算をする必要があります。例えば「平均」を求めるときには、すべての数値を足して、標本数(人数など)で割ることで平均値を求めます。このように、どのような場面でも計算がつきまといます。なので、計算は絶対したくないし、PCとか触りたくないという人は、どうかその点だけご容赦ください。

 

以上2つが、まず前提として頭の片隅においておいて欲しいことです。この点をクリアーできれば、統計学の世界に足を踏み入れる準備ができたということになります。

 

統計解析のソフトウェアについて

さて、統計解析を紙の上でやるわけにはいかないので、ソフトウェアを利用しましょう。ただ、このブログではExcelは使用しません。"R"という統計解析に特化したフリーソフトを利用します。Rは統計の世界では非常によく使われるソフトウェアです。このソフトウェアの利用方法についても、次回以降説明していきます(使い方は難しくはありません!)

f:id:tomoshige_n:20140121012840j:plain

 

次回からの内容

f:id:tomoshige_n:20140121012920p:plain

なので次回は、まず統計解析をやってみよう!ということで早速Rを使ってデータを簡単に解析したり、図示したりしようと思います。ソフトのインストール方法から、基本的な統計の話までを書いていこうと思いますので、興味のある方は引き続きよろしくお願いします。

次回を読んで頂ければ、上のような図を書いたり、その他の簡単な統計処理ができるようになって、楽しくなってくると思います!

 

それでは。