人間の(知的)能力はpower lawに従うのか

id:rkmt:20070503 のCHI2007で報告された「Wikipediaのコントリビューションは上位1%の参加者によるものが全体の50%を占める話」がまだ気になっているのでちょっと続きを書いてみる。最近は power law (べき分布)に従う事例が次々に報告されているので、これも yet another example に過ぎないという気も一瞬したが、やはりそんなに自明でなことではないと思う。

というのは本やCDの売れ方がpower law なのは、「売れているものはさらに売れる傾向にある」という説明で何となく納得してしまうが、Wikipediaの場合「能力のあるcontributerの能力がさらに向上する」というメカニズムはぱっと思いつかない。

まさか

「あなたはWikipediaに一杯書いていて、偉いですね」

と皆に言われるのですます張り切る、なんてことはありそうもない。

あるいは、

Wikipediaに書き続けることで知識や文章能力が向上する」

はもう少し有り得そうだが、それだけで「1% : 50%」が形成されるのだろうか。


だとすると、「そもそも人間の(知的)能力がpower law に従っている」 と考えるほうが自然ではないだろうか。

プログラミングの能力などはpower lawだというのは実感にも合っている気がする。Wikipediaのコントリビューションの場合、能力というのが文章作成能力なのか、知識なのか、費やすことのできる時間なのか、あるいは熱意なのか、色々あると思うが、それらの総合的能力が power lawに従っているということなのだろうか。

では人間の知的能力はpower law というのを受け入れるとすると、我々の慣れ親しんだ社会システムに反していないか?

たとえば「学校の成績」というのは一体何だったのだろうか。通信簿というのは確か正規分布になるように5 4 3 2 1 を割り振れと指導要領によって決められていたのではなかったっけ?偏差値も正規分布が前提の体系ではなかったか。本来冪法則のものを無理やり正規分布であるかのように扱っていたのだろうか。

で、ふと気づいたが、学校の試験というのは満点以上は取れないんですね。というので少し納得しました。

つまり、試験用紙が配られて、5分で解いてしまっても、制限時間ぎりぎりまで粘って解いても、100点だったら100点。それ以上の点数はない。5分だから500点になるということはない。「こんな問題やさしすぎて物足りない」と思っても「ああ難しいやっと解けた」でも同じ100点。なので学校の試験というのは人間の能力を一定の上限値で切ったデータにすぎない。それ以上のものを計測することは出来ない(満点以下の場合に、試験の成績が人間の知的能力を正しく反映しているかどうか、は一応置いておくとしても)。とすると、現在学校で行われている「成績づけ」という行為は、ある一定値で制限を掛けたデータ(冪分布に従っているかも知れない)を、擬似的に正規分布で近似している、ということなのだろう。

しかし、試験の成績以外にも、人間を評価する(される)場面は多いが、何となくテストの延長で正規分布に従うとしてやってしまっていないだろうか?たとえば企業で社員を評価するのにABCDEの5段階でつけてしまうとか、論文の査読とか。

一方、人間の身体能力というのは身長や体重などから考えても、正規分布に従っていると考えるのが妥当だろう。スポーツ界でスーパースターは存在するが、あれは単純な身体能力だけではなく知的能力との複合能力だと考えるとこれも納得がいく。Rawな身体能力だけだとそんなに差はでないのではないだろうか?

追記 (2007.05.30)

mixiのほうで,「知能指数テストのように、満点がとれないように最初から設計されている試験では結果が正規分布になるみたい」との指摘を頂きました。同様に学校の通常の試験は「一定時間内に、すでに答が存在しているし解法も広く知られている問題を如何に正確に解いていくか」という趣旨で出題されているので、上で述べた「rawな身体能力」と同じ範疇なのかもしれません。その場合,人間が持っているであろう裸の(rawな)知的能力はたぶん正規分布であると思われるが、Wikipedia へコントリビュートするような総合的な知的能力は冪分布になるということで、そのギャップがなぜ発生するのかが興味深いところです。