ちょっと硬派なコンピュータフリークのBlogです。

カスタム検索

2013-08-15

書評:「統計学が最強の学問である」→ はい。


この本を手に取ったのは単に売れているという理由からではない。むしろ話題になっても「なんかミーハーなタイトルだなー」ぐらいにしか思わず、あまり興味がわかなかった。

ところが、先日同僚の木村氏に誘われて参加した飲み会で、なんと著者の西内氏と話すという幸運な機会に恵まれた。西内氏は話が非常に上手で、ユーモアのセンスや頭の回転の速さ、そして匂い立つリア充臭を醸し出していた。著者に興味がわけば、著書にも興味がわくのが人情である。そして読んだ結果、とても面白い本だったので皆さんに紹介しようと思う。

統計学のいろはが分かる

本書はミーハーなタイトルとは裏腹に、ストーリーに沿ってとても上手に「統計学のエッセンス」を伝えてくれる。専門書ではないので統計学のディテールには踏み込まないものの、要点を的確にピックアップしており「統計学ってどんなもの?どんなふうに使うの?」というクエスチョンに見事に答えている。一般向けの書籍であり、統計学の専門家にとっては退屈かも知れない。とはいえ、まったくの無学な人に分かるような内容ではないので、ズブの素人には厳しいが理系の大学出身者であれば難なく読み進めることができるような内容であると言える。理系出身でなくとも数字に強ければ理解可能なので、経済学や経理などの知識があれば難しく感じることはないだろう。

統計学がどのような状況下で育ったかというエピソードが多数紹介されているのもポイントが高い。おかげで最後まで飽きることなく読み進めることができた。

「おっさん」への痛烈な批判

本書では、たびたび「おっさん」なるものへの批判が登場する。統計学的な知識を持っていないながら年を重ねているというだけで決定権を持った立場におり、自らの経験と勘だけから合理的でない(=統計的な裏付けのない)決断をしてしまう具現者の比喩としてである。人によってはそのような存在のことを「老害」と言うかも知れない。

厄介なおっさんたちの言動は実にリアリティに満ちた表現で描かれており、読者は否応なしに実物の「おっさん」を想起させられることだろう。その結果、過去の苦い経験を思い出して暗澹たる気持ちにさせてくれること請け合いである。だが、そのようなおっさんたちは本書で完膚なきまでに論破されることになる。実に爽快だ。

ビッグデータ

ビッグデータも西内氏の手にかかればバッサリである。要点はこうだ。(注:これは私による要約であり、西内氏の文章ではない。)

「サンプリングもせずデータをビッグなまま解析するなんて、アホじゃね?」

まさしくその通り!!データがデカければ適切にサンプリングすればいいだけの話だ。議論の続きについては書籍を参照して貰いたいが、賢明な読者諸氏は「ビッグデータ」というバズワードに惑わされないように注意して頂きたいと思う。

インフラ野郎が身に付けるべき統計学

なぜこの書籍をブログで取り上げようと思ったのかというと、実は統計学に関する知識というのはインフラ野郎にとっても重要だからだ。統計学はありとあらゆる分野で必要となる知識であり、それは本ブログの読者のマジョリティであるインフラ野郎も例外ではない。

あなたはインフラ野郎だろうか。もしそうであればこの言葉を一日のうち何度耳にするだろうか。

パフォーマンス。

コンピュータの持つパワーを余すことなく使うため、コンピュータが行える処理の限界を知るため、または限界を迎える前にリソースの増強などの手を打つため、我々はパフォーマンスと格闘する日々を送っている。パフォーマンスが良いか悪いかということを、どうやって判断しているかを思い出して欲しい。そう、あなたは正しく何らかの「統計的なデータ」を見ているはずだ。パフォーマンスの解析を行うには、当然統計学的なリテラシーが必要となる。リテラシーがないと

「CPUの使用率が100%になっている。異常だ、何とかしてくれ!」

という素っ頓狂な発言をしてしまうことになる。(CPUの使用率が高いことと、パフォーマンスに問題があるかどうかは状況次第であり、因果関係を探るには統計学的な判断が求められる。CPU使用率が高いこと自体が異常なわけではない。)

パフォーマンスの改善をする上ではベンチマークテストが非常に重要となる。コンピュータシステム、あるいはコンピュータソフトウェアのパフォーマンスは、結果を左右する因子が多すぎるため、理屈であれこれ考えただけでは結果は分からない。机上の空論は通用しない世界である。「こうすれば速くなるはずだ」と思ってパフォーマンスを測定したところ、返ってよくない結果になってしまったというようなことは日常茶飯事だ。だから、パフォーマンスが良くなるかどうかはベンチマークで確かめるしかないのである。だから統計学が必要なのだ。

特許について

とても楽しく役立つ良書であるが、一点だけ物申す部分がある。それは次のくだりである。

(p.22より抜粋)
経済成長において重要なのは「技術の進歩」であり、さらに、技術の進歩に寄与する教育レベルや技術開発を行った場合に、その利益が開発者に適切に配分されるかという「社会の制度」(たとえば特許制度など)であり、逆に天然資源の有無などが関連しているとは言えない、といったことが明らかにされてきたのだ。

この「特許制度」に対する認識はいただけない。これは西内氏のいう「おっさん」たちがよくやる、経験と勘による思い込みではないだろうか。特許とはアイデアの独占であり、独占は経済を停滞させる要因に他ならない。アイデアの独占は有害だ。特許はイノベーションを加速させるどころか、新たなイノベーションが生み出されるのを邪魔する存在ですらある。

ただし、過去に特許制度がまったくイノベーションの促進に寄与しなかったわけではない。例えば、およそ四世紀前の欧米諸国において、中世語の専制主義から脱却したとき(つまり王侯貴族だけが持っていたアイデアの独占権が特許制度によって個人に与えられるようになったとき)は、市場はより自由な方向へとシフトしたためイノベーションが増加した。また、特許制度が制定された直後も一時的にイノベーションが増加する。イノベーションは通常他のイノベーションの上に築かれるものなので、既にアイデアが独占されてしまっていると、イノベーションは停滞してしまう。こういった事実は統計的に明らかになったことだ。話は逸れるが、現在は世界的に経済が行き詰まってしまっているが、これもひとえに特許制度によるものだと言えよう。

特許が如何にイノベーションを阻害するかということについては、以前ブログで紹介した「<反>知的独占」を当たって欲しいと思う。この書籍は膨大な研究や論文に基いたものであり、統計学的なエビデンスの強度としては「メタアナリシス」に相当する。ぜひ西内氏にも読んで頂きたいと思う。(参考文献に<反>知的独占は入っていない模様。)

なお、物申す部分があるからといって、本書が全くダメな書籍だなどというつもりは毛頭ない。既に述べたとおり、全体としては非常にオススメの書籍である。

「おわりに」でガラリと変わる印象

本文は軽いテンポでサクサク進んでいくのだが、「おわりに」を読むとその印象がガラリと変わって見えてくる。ネタバレを避けるため内容については触れないが、ひとことでいうと「熱い」!!

「おわりに」は西内氏のプライベートの話から入るのだが、なぜ西内氏が統計学を志すようになったのかを窺い知ることができる。そして、統計学にかける熱い想いが伝わってくる。

そういった意味でも「統計学が最強の学問である」は大いに刺激的な一冊である。

0 コメント:

コメントを投稿