学習の一般モデルとしての機械学習と一万時間の法則

一万時間の法則というのがあるという。ある分野を習得し，スペシャリストとしての素養を身につけるまでの時間が10000時間という法則だ。十分な経験が専門性には不可欠ということは当たり前として，閾値がセットされることに対しては多少の違和感があった。

スペシャリストとして飯を食うために必要なのは素養の絶対量ではなく，他の人よりもその分野に詳しいという相対的素養だろう。そうすると，10000時間というのは母集団の中で秀でるために必要な時間ということになる。例えば需要に対して，その分野の専門家として必要とされる専門家の割合が1%であるなら3σだけ世間の能力値の母平均から逸脱するために時間をかける必要なる。しかし例えばプロピアニストと学校の先生では必要とされる数が異なっているだろうし，データサイエンティストのように膨大なニーズを抱える領域ではσくらいの逸脱でも飯のタネにありつけるかもしれない。*1

最近，俺の心をつかんで離さないアイディアがある。学習とはパラメタの最適化だという考えだ。実用上機械学習は人間の学習を機械に導入する際のモデルということと思うが，むしろ学習という行為の本質をえぐっているように思える。直接の関係性は薄いかもしれないが，チョムスキーの生成文法はこのアイディアと相性が良いだろう。人間が生得的に持っている普遍文法の構造については別に議論が必要だろうが，語順や移動に関するパラメタを経験から習得することで，ある言語を身につけていくモデルは機械学習が明示的にモデル化した学習プロセスと整合するだろう。

生まれたときにどのようなパラメタ（ニューロン間の結合定数分布）を備えているかは個体間の差があることは否定しない。それが才能と呼ばれるものなのかもしれないし，才能がある人はスタートラインがちょっと他の人より前にあるのかもしれない。しかしながらパラメタを最適化するプロセスというのはそれほど個人差はないのだろう。だからこそ10000時間の法則はそれなりの妥当性があるのだろう。

*1:その場合，必要な修業時間は1/9程度≒1000時間程度で足りるのだろうか？