基本読書

基本的に読書のこととか書く日記ブログです。

なぜ、AIは東大へ入れなかったのか?──『AI vs. 教科書が読めない子どもたち』

AI vs. 教科書が読めない子どもたち

AI vs. 教科書が読めない子どもたち

人工知能が東大合格を目指すチャレンジがあったことをご存知だろうか。東ロボ君と名付けられたその人工知能は2011年から16年までさまざまな方法で学力を高め、最終的にはMARCHレベルの大学まで入れる能力を身に着けたあと、現代の技術の延長線上では東大合格に至るのは困難などの判断が入り、開発はいったん中断となった。

本書『AI vs. 教科書が読めない子どもたち』はその「ロボットは東大に入れるか」プロジェクトでディレクタを務めた新井紀子さんによる、「なぜ東ロボくんは東大合格が(このままでは)不可能なのか」というAI技術の可能性と限界について、またその結果みえてきた、意外と子どもたち(というか人類)は読解力がないんじゃね? という仮説の検証、人間に残された仕事についての調査・研究を纏めた一冊である。

もともと新井紀子さんの雑誌のインタビューや対談などを読んでいて、こりゃめちゃくちゃおもしろいわと思っていたのでこうやって本にまとまったのは嬉しい限り。近年よくある「シンギュラリティ」や、AIが人類を労働から解放する──などといった”夢物語”が、なぜ夢物語なのかを端的に示してみせ、そのかわりに”本当に消えてしまう仕事”と、”残る仕事”は何なのか、また人がその仕事をこなすために必要な能力とは何なのかを教えてくれる、AI本としてもきちっとした内容である。

どうやって問題を解いているのか

さて、本書の前半部は主に東ロボくんはどのように問題をといているのか? という技術的な解説と、”なぜMARCHはいけても東大にはいけないのか?”という限界についての話になる。その実態は、機械学習などをよく知らない人からみると(ある程度知ってても)「そんな無茶苦茶なことやってんの?」と驚くような内容だろう。

たとえば、世界史と日本史の問題をどう解くのか? センター入試では世界史と日本史の問題の7割弱が「正誤判定問題」であることがわかっている。「カロリング朝フランク王国が建国された8世紀に起こった出来事について述べた文として正しいものを、次のうちから一つ選べ。」的な問題が出るわけで、普通に考えたらその文章を読み取って検索するかデータの参照を行い選択文と比較する(どうやるのかしらんが)のかな……と思いそうなもんだが、東ロボくんはそもそも”出題文を読まない”のだ。

じゃあどうするのかといえば、まず「選択肢からクイズ問題を自力でつくる」という方式を採用している。これによって「カール大帝は、マジャール人を撃退した」という選択肢から「カール大帝は、○○を撃退した。この○○は何か」という穴埋め問題をつくる。この際にあらかじめ用意した「マジャール人は民族である」とか、「死んだ人はそれ以降の事柄を起こせない」といった当たり前の知識を整備した「オントロジー」をふまえて、○○の部分により正しい分類のものが当てはまるように精度を高め、その後○○に当てはまりそうな固有名詞を出現頻度などでランキング化する。

その結果として最も高いスコアを獲得したのが「マジャール人」ではなく「アヴァール人」で、両者のスコアの差が大きければその回答は誤答だと判断するのである。ええ、めちゃくちゃ遠回りやんけと思うし実際遠回りなのだが、質問文から推測するよりもはるかに高い正答率をはじきだし、15年、世界史の東ロボくんは正答率が75%に上昇。偏差値は10以上上がり66.5になったのだという。めっちゃ賢いやつだな。

で、当然ながらこのやり方は世界史や日本史にしか使うことができず、数学や国語では全く別のやり方を使わなければならないわけだがその辺は読んで確かめて欲しい。

なぜ東大には合格できないのか

東ロボくんはそんなふうにかなりの力技でなんとかしていくわけだけれども、過去問やウィキペディアといった知的資源や数式処理などをフルで使っての最終的な成果は偏差値57.1である。充分に高いが、東京大学の偏差値は77以上だから、かなり厳しい。でも、5年でそこまでいったんだからもっとがんばればいずれ東大にいけるんじゃないの──と思うかもしれないが、現在の技術的にはこれ以上いくのは困難だ。

たとえばビッグデータを使って機械学習させれば精度は上げられると思うかもしれないが、過去問の数は「ビッグ」とは程遠く、問題の提出傾向も変わってくるのでとても無理だし、計算速度の問題でもないのでスパコンを投入しても無駄である。先の世界史の件では劇的な向上をもたらしたが、あれも既存の技術の使い方を変えただけ。

 つまり、「真の意味でのAI」が人間と同等の知能を得るには、私たちの脳が、意識無意識を問わず認識していることをすべて計算可能な数式に置き換えることができる、ということを意味します。しかし、今のところ、数学で数式に置き換えることができるのは、論理的に言えること、統計的に言えること、確率的に言えることの3つだけです。そして、私たちの認識を、すべて論理、統計、確率に還元することはできません。

AIには我々が当たり前に理解する「意味」がわからず、こうした数学の言葉だけで動く限り、東大にも合格できないしシンギュラリティも絶対にやってこないのだ。

人間の時代──がこないかも

現代のAI技術はMARCHレベルの能力は有しているのだから、人間の仕事の大半はAIによって置き換えられてしまうだろう。そうなったら人間は人間にしかできない仕事をすればいいわけだけれども──、大半の人間はその知的能力において東ロボ君に負けているわけで、このままじゃほんとに人間の大半はお役御免であるというのが、「ロボットは東大に入れるか」プロジェクトで見えてきた端的な事実でもあった。

そこで著者は”子どもたちの基礎的な読解力のレベルはどの程度なのか?”、また”読解力のレベルは偏差値にどの程度影響をあたえるのか?”といった調査を行う前例のないプロジェクトを開始し、これから先の社会の変容を見据え提言を行っていく。

”どうすれば読解力は増すのか”、”豊かな発想を持ってAIに代替できない仕事を生み出せるのか”などなど、まだまだわからないことだらけだが、少なくとも本書は”どこまでわかっていて”、”どこからがわからないのか”という線を綺麗に引いてくれる。限界が正しくわかれば過度な妄想を抱くこともなく、その限界を乗り越えるために何を考えればいいかもわかりやすくなる。現在の状況を真摯に捉えた一冊だ。

あわせて読みたい

川添愛さんは本書にもオントロジーの作成協力者として名前の出て来る言語研究者・作家さんで、書かれてきた本はどれも本書と同じくAIの持つ可能性と限界についてじっくり語られたおもしろいものばかり。あわせて読みたい本ばかりだ。

自動人形の城(オートマトンの城): 人工知能の意図理解をめぐる物語

自動人形の城(オートマトンの城): 人工知能の意図理解をめぐる物語

働きたくないイタチと言葉がわかるロボット  人工知能から考える「人と言葉」

働きたくないイタチと言葉がわかるロボット 人工知能から考える「人と言葉」