データの読み方2

直感によって歪められるデータ

  JISに乱数表という0から9までの数字の羅列がある。よく見ると、同じ数字が連なっていたり、ある数字がかなりの区間にわたって出てこない事が分かる。これがランダムと言うものだ。学生に100個の数字をできるだけランダムに書かせてみると、乱数表にあるような現象はなくなり、同じ数字が連なることはない。だから、それは乱数とは言わない。エクセルを使うとさまざまな種類の乱数を作ることができる。エクセルはある計算式に従って乱数を発生するから、偏りがあるのは避けられない。それでも普通のシミュレーションでは使える。

 

  世の中には様々なデータが飛び交っているが、これらのデータは利用する人の感性で使われているから、いつも疑ってみることが要求されている。人の直観力は僅かなデータでも、或る意図にそって或る種の規則性を見出すことを得意としている。観察した僅かな事象から、典型的な例として物語りを作りやすい。壁の模様から、さまざまな人や動物の顔を連想したりすることもできる。車の4桁のナンバープレートには、同じ数が4つ並ぶ場合もあるが、これを見ると、殆どの人が「珍しい番号」と認識する。しかし、これは9999個ある番号の1つだから、どの番号でも現れる頻度は同じなはずだ。


  百円硬貨を10回投げたら、表が10回出たケースと、表が5回で裏が5回出たケースがあった。確率の計算をすれば、どの場合も、0.5の10乗であるから全く同じである。ところが、人は表と裏のパターンとして見るから、表が10回も出るのは珍しいと思ってしまう。理論から導かれる結論以上に、平均的な事象が多く起こるものだという直観をもつ事が分かる。このような統計的な誤認は少数の法則として、2004年にノーベル経済学賞を受賞したカーネマンによって研究されている。これは、大数の法則が少数の試行回数でも成立しているとの誤解を持っているという仮説である。

   人は何かの機会に聞いた話を、他の人に伝えるとき、自分でかなり一般化して「皆もそう行っている」と敷衍してしまう事は普通の事である。まことにデータの解釈は難しいものだ。そのような認識を持つ事で、判断を誤らないようにすることができる。



*乱数表:http://www.mhlw.go.jp/shingi/2009/12/dl/s1211-17c10.pdf

ツイッターhttps://twitter.com/#!/goroh