「区別のつかない赤玉」たち・・・
確率の問題でこんなの見たことあるでしょ?「袋の中に区別のつかない赤玉が10個、区別のつかない白玉が5個入っている。そこから3個取り出すとき、・・・」。
でも、「区別がつかない」っていったいどういうことなんだろう?テーブルの上に転がっている2個の赤玉は、左側に転がっている赤玉と、右側に転がっている赤玉、というように、「存在」としては明らかに「異なる」赤玉なのだ。それを「区別がつかない」と「言う」のはそれを見る人間の「認識」の問題なのであって、ところで、「認識」のレベルは人によって異なる。たとえば私は、今大量の猫たちと同居しているが、かつて、猫なんかに何の関心もなかったころには、目の前を野良猫が通り過ぎても、「あ、猫だ」としか感じなかった。今なら「少し茶が多めのキジトラの長毛種で、かぎシッポ」ぐらいのことは言える。ある人類学者の報告によれば、遊牧民の羊飼いは、150頭の羊を識別できるという。
だから、人間が並んでいる赤玉の区別をつけられ「ない」ことは、ありえない。
区別「しないことにした」だけだ。「区別しない」とは、「赤い」、「玉」であること以外の一切の「属性」を剥奪した、ということだ。「猫」を「猫」としてしか見ないということは、その生暖かい毛むくじゃらの生き物が、さまざまな色合いの瞳と、さまざまな肌触りの被毛を持ち、さまざまな声でなく、などというあらゆる個体としての「属性」を奪い取ってしまったということなんだ。
あなたが「赤玉」の声を聞くことができるなら、「あたしを隣のやつなんかと一緒にしないでぇ!あたしはあたしよ!」と、彼らは悲鳴を上げているかもしれない。
ただひとつの属性を残してその他一切を剥奪することで、初めて私たちは対象を「マクロ」の視線で捉えることができる。対象を「マス(mass)・集団」として扱うことが可能になる。
気体の分子が、質量と速度のみをその「属性」として有する「区別のつかない」粒子であると仮定することで、初めて熱力学的な分析が可能になった。
理想的な購買行動をする消費者、合理的な生産計画を立てる生産者、最も功利的に投資を行う投資者・・・などなど、模範的な「経済人」をモデルとして、経済学は組み立てられてきた。
こうしてあなたは、「模範的な受験生」であること以外の一切の「属性」を持たない、「区別のつかない赤玉」として、模擬テスト会社の、統計システムの中に1データとして入力された。
これらの統計システムは、全受験生を「マス」として扱うことにおいては、もちろん有用だ。
それが可能なのは、一つ一つのデータが「代替可能」な対象だからであって、たとえば、あなたという一人の個人が、もうこんな生活いや!っと、受験勉強からドロップアウトしてしまったとしても、あなたが入力されたシステムの信頼性はなんら変わらない。「同程度」の成績の、「同種」の志望校を選択した、他の受験生のデータが、あなたのデータの穴を埋めてくれるからだ。
集団の分布の形状を示す指標に「標準偏差σ(シグマ)」という概念があって、これが小さければ平均値を中心に固まったシャープな分布、大きければ、裾野の広い緩やかな分布を示すことになる。「標準正規分布」と呼ばれる理論的な分布形になぞらえると、平均値±1σの間に約78パーセントのデータが収まることが知られている。これをおそらく「素人にもわかりやすい」用語にしたのが「偏差値」で、平均値を一律50、1シグマを10として、個々のデータに値を割り当てた。
上の理屈から言えば、偏差値40と60の間に全データの8割弱が収まることになる。つまり「普通」だ。
だから、これは集団の中で個々のデータがどのあたりに位置するかをわかりやすく表現するという意味では有用かもしれない。テストの問題の難易度、受験者数の増減などにもかかわらず、「標準化」されているから。
でも二つ以上の偏差値の値を「比較」するという作業に、「意味」があるのかどうか?私はいつも疑問に思ってしまう。
私たちは、「代替可能」な「区別がつかない赤玉」なのよ!私たちが「区別のつかない赤玉」になりきることで初めて、統計データの処理が可能になった。なのに、そこで突如として、「個性」を発揮して、ほかならぬ生身の「私」が、「1ヶ月前より今のほうが偏差値が3上がった」などということに意味があるだろうか?あるという人もいるだろう。あるという振りをすることもできるだろう。
でも声を大にして言わせてね。
そんなことに意味はない!
時間を隔てた二つの統計データの、「代替可能」な「区別のつかない赤玉」のひとつを取り出して、その「偏差値」を比較することは、この部屋を満たしている空気のうちのある特定の窒素分子が3秒後にどこにいるのかを議論するのと同じくらい、無意味だ。
前回のテストよりも偏差値が上がったとか下がった、だからどうだとか、ましてや今の偏差値では、来年の志望校の合格は可能とか無理とか、そんな脅迫じみた説話を信じたければ信じたらいいよ。でも、もし、信じたくないのなら・・・信じなくていいです。信じないことを私は「支持」します。
そんなものは「統計学」の「誤用」だ!
と、鼻で笑ってやれ。
思い出してください、私たちは「区別のつく」赤玉なんです。泣きもすれば笑いもできる、恋もすれば傷つきもする、怒りもすれば絶望もする、手首を切れば生暖かい血がたらりと流れる「生身」の赤玉なんです。
私とあなたが「違う」ということが、私たちの「多様性」の根拠です。「多様性」の幅が広がれば広がるほど、「誤差」は大きくなります。予測の「不確かさ」は大きくなります。うまく前の話に戻ったでしょ?
私たちの行動は決して「合理的」ではありません。模範的な「サンプル」ではないんです。私が「48歳日本人男性」の平均値でないのと同じくらいあなたたちは「平均的な受験生」ではありません。
平均的でないことが、またしても「誤差」を増幅します。
「誤差」の増幅は、冷徹な「誤差伝播の法則」の原理にしたがって、さらに増幅を続け、やがて「予測」そのものが意味を持ち得ない地点で「飽和」します。あなたはAかもしれない、が、Aでないかもしれない。その確率が、「ほぼ5分5分」となったとき、「あなたはAである」というステートメント(言明)が100パーセント、完全に意味を失います。
ここまでの話をまとめます。
- 「勉強をした」という事実と、「成績が上がった」という事実との間には、原理的に、なんらの「因果関係」も存しない。
私たちは、「1対1対応」の「単能ペイガム・マシン」ではないから。
- 時間を隔てた二つ以上の統計データの中に含まれる「私」、かつて「私」であったもの、を「比較」することには、原理的に、意味がない。
「私」が「代替可能」な「区別のつかない」データとなることで、統計データが成立したはずなのに、そこに「不代替的」な「ほかならぬ私」を持ち込むことは、レベルの混同であるから。
- 「誤差」の蓄積が、「予測」を無意味にしてしまう地点が、必ず存在する。
前・戻る・次