Data Science by R and Python

統計学を、広く、深く、わかりやすく。

【雑記|個人的見解として】大学の統計教育で統計を現場で使える人材は生まれるか?+何をすべきか?

* 本記事について(8/16)
本記事について、所属をかいたまま所見を述べるのは不適切であるという指摘をいただきましたので修正いたします。
また、表現上適切ではない箇所がありますので、その点を加筆・修正いたします。

追記(8/16)

それから、これは追記しておくべきかと思ったので。下記の意見は、既存の大学教育の枠組み・統計教育の枠組みを批判することが目的ではありません。むしろ、私たち学生が学んだことを現場で活かす上で、何をすれば良いのかと考えた一意見です。以上の点のみ、誤解されないようによろしくお願いいたします。

今日は、雑記

夏休みは毎日、できる限り毎日ブログは更新しようと思うんですが、統計の内容だけで更新していくのはとてつもなくキツいので、雑記も挟んでいきます。今日のテーマは「統計教育」(うちの大学で僕が学んできたことに基づく)ということです。あくまで、個人的な意見ですし、先生方がどういう意図で授業等を構成されているのかはきちんと把握していませんので、その点に齟齬があるかもしれないということを、まず最初に断っておきます。

大学の統計教育の今(うちの大学編)

ここ2年ぐらいで、中・高の数学の授業に「統計」の項目ができました。国も必死に統計教育を進めていこうとしているのが伺えます。現場を見てみたいのですが、実際それは叶わなそうなので、うちの大学の統計教育の今について書いてみます。

大学の統計教育(学部)の今

現在、僕は所属している大学で、統計学を勉強しています。学科の特性上、もちろん個別具体的な領域を研究する方もいらっしゃいますし、一方で経済に特化したり、生物学に特化するということもなく、むしろ統計学で用いる数理的手法の研究がメイン研究される方も一定割合います。

そんな、うちの学科の統計学の授業をご紹介しておくと、以下のような授業があります。

ちなみに、この授業は3年生以上が対象です。実際、2年生までは統計の授業はほとんどなく全て数学の授業です。見ていただくとわかるように、解析の4年間通して授業は2つしかありません。数理統計を専攻するからかもしれませんが、実際のデータを用いた解析は「ほとんど」やってきた実感が僕にはありません。

大学の授業では、基本的に統計学の理論を勉強してきた記憶があります。残念なことに「社会で求められている統計的スキル=解析力」は僕は、養われた気はしませんでした(それは、現場で使う場合にはコミュニケーション力や様々な能力が必要なるということを含めてです)。これが、僕が感じていることです。
あと、なんとなくですが基本的に「ITのスキル」はそれほど高くなった気がしませんでした。触れる機会が特になかったからです。よく、統計学ってことはPCとかプログラミングとかできるでしょ?と言われますが、ことのほかそういうことには疎いですし、自分で勉強しないと完全に周りに置いていかれてしまいます。(ただ、2つ後に述べるように悪いところだけではないんですよ!)

現場との乖離はどこから

現場で用いる統計の能力というのは、おおよそ経験的に「目的に照らし合わせて、仮説を作り、どの手法を選択するか」につきると私は思っていますが、学科においてその能力が授業で養われたのか?と僕は自分が過去に授業を受けてきて疑問があります。なんとなく、自分の中でしっくりくる理由はいくつかあげておくと...

  • 扱うデータが偏っていたのかもしれない。
  • 解析の目的が『はっきりせず、現実味がなかった』のかな?
  • 誰かと一緒に解析する経験が少なく、議論しなかったから?

つまり、今のうちの学科の教育は理論研究者育成に近い気するかもと、一時期思ったこともあります。これは、意図がどうあれ、受け手が感じていることが問題で、日本でデータサイエンティストが20万人必要と言われていますけど、今の大学では、なんというかデータサイエンスに魅力を感じる仕掛けがまだできていないので、人が育たない気がしてしまうんですよね。

ちなみに、「目的に照らし合わせて、仮説を作り、どの手法を選択するか」というのは、統計に限らず、おそらく誰もが鍛え続けるべきスキルだと思っています。

もちろん強みも

もちろん、悪いところばかりではありません。数理を専攻し数学を起点に統計学を学ぶことはとても意味がありますし、それはよく感じます。それは特に、理論が持つ「仮定」に敏感になるということにあります。世の中で用いられている多くの統計的手法には「仮定を無視した」適切ではない使われ方をしているものがあるということも耳にします。「仮定を無視する」のがそれほど問題なのかというと、問題が起こります。それは「予測結果」を大幅に大きく見積もったり、「信頼区間」を小さく見積もったりしてしまうことで、結果がねじ曲げられてしまったりするからです(これは、野球データの解析でも少し触れました)。理論を学んでいると、このデータに適応する手法の「仮定」にはとても敏感になるので、誤った手法を用いる可能性は低くなりますし、結果に対する解釈・見通しを立てるときでも数学的に議論を進めることができるので、解釈にぶれが生まれにくくなります。同時に、理論面を知っていることというのは、現場で仮説を作るスピードの向上にもつながっているように感じます。

学生はどうすればいいのか?

個人的には、上記のようなことから言えるのは、学生は外に飛び出てみてはどうだろう?ということです。大学では「理論」を、現場で「実践」をすることを通して、「理論」と「現場」を結びつけるということにとても価値を感じます。
やはり、大学は大学であるし、企業には企業なりのやり方があるんだという、文化の差を肌で感じるのはとても大事だと思いますし、企業でデータを扱うことってとても刺激的だなぁと僕は思っています。
データを企業で扱うと、大学では扱わないような問題にたくさん直面します。とにかくデータは「前処理が8割」ということがわかったり、研究データの「デザインされてる」ことの意味に気づいたりと、勉強になることばかりです。それから、あ、自分はこれやりたいかも!という新しいテーマに出会えることが多いのも魅力の一つです。

実際、世の中にあふれているデータは、私たちが想像するより多種多様で「扱い方」が明確になっていないものばかりだと僕は思います。そういう意味で、現場に出れば「テーマ」は山のようにありますし、加えて「現場から課題を拾えば、人の役に立つ手法」を開発することにつながりやすく、『やっている』という実感が得やすい分、僕みたいな『意味のないことをやりたくない』人間には、モチベーションが湧きやすくなります。




おわりに

と、今回は雑記的に思っていることを書いておきました。あくまで個人的意見です。
さて、研究にもどろう。。。