基本読書

基本的に読書のこととか書く日記ブログです。

言語研究者は日々どのような「怪物」を相手にしているのか──『働きたくないイタチと言葉がわかるロボット 人工知能から考える「人と言葉」』

働きたくないイタチと言葉がわかるロボット  人工知能から考える「人と言葉」

働きたくないイタチと言葉がわかるロボット 人工知能から考える「人と言葉」

数学的原理に裏打ちされた傑作ファンタジィ小説である『白と黒のとびら: オートマトンと形式言語をめぐる冒険』『精霊の箱: チューリングマシンをめぐる冒険』の著者である川添愛さん(理論言語学、自然言語処理が専門の研究者)の最新作は、なんでもできるロボットをつくって労働を全部肩代わりしてもらいたい! と考えそのまんま実行にうつしてしまった、怠け者のイタチたちの物語だ。
huyukiitoichi.hatenadiary.jp
そら、なんでもできるロボットができればなんでもやってくれるのだから労働もやってくれるはずだが、現実問題としてできていないのだから事はそう簡単ではない。まず「○○をやってくれ」という言葉/指示を「分かって」くれる知能の搭載が必要だが、そもそも「言葉が分かる」とはどういうことなのだろうか──? というのが、物語と同時進行する、ノンフィクションとしての本書のテーマだ。

言葉が分かるってそりゃ言葉が分かるってことだよ、と思うかもしれないし、人間同士ならまったくその通りだが、機械にそれを分かってもらうのは困難だ。たとえばある男性が「恋人を探しているんだ」と言った時に、その意味が「恋人が今どこにいるのかを探している」のか、「そもそも恋人がいないので、相手を探している」のか、といったことは前後の文脈を正しく把握しなければ判断できないのだ。

本書では、イタチたちがいろんなロボットをつくっている動物たちの村をまわって、「なにができるのか」と「なにができないのか」を少しずつ学んでいく。最終的には、機械学習やディープラーニングなど現在の技術でいったいどれほどの「言葉が分かる」ロボットが出来るのか、というところにまでたどり着いてみせる。

機械学習などの理論についてはもちろんそれ専用の専門書の方がしっかり説明しているが、本書のように"機械に言葉を分からせるための困難さ"という軸で紹介されると、いくらかこの分野について知識があっても、また違った側面、あるいは全体像があらためてみえるようになる。何しろイタチたちの話はゆるい童話的で、とってもコミカルだが、彼らが取り組むのは人類が未だ打倒しえない「怪物」なのだ。

しかし少なくとも、「この課題をクリアしない限り、言葉を理解しているとは言えない」という、「言語学者から見て絶対に譲れないライン」は提示したつもりです。この本を通して、言語の研究者が日々どのような「怪物」を相手にしているかを、読者の皆様に少しでも感じていただければ嬉しく思います。

本書の内容をもう少し具体的に紹介する。

と、そんなところで本書の内容をもう少し紹介すると、たとえば第一章ではイタチたちはモグラの村へと赴き、発言を聞き取ることのできるモグラの耳と呼ばれる機械に遭遇する。「こんにちは」といえば「こんにちは」と返ってくるが、長文になると精度は落ち、方言を喋るイタチの発言はまったく聞き取ることができない。

それは何故なのか? を理解するためには、どのようにして機械に言葉の音声を認識させるのか、という技術面を理解しなければならない。たとえば、このモグラの耳は純粋に音声を聞き取っているわけではなく、「話された言葉」を「あらかじめ登録された単語の列に相当するもの」に変える、という処理を行っている。つまり、単語を登録していないマイナな方言などは当然ながら聞き取ることはできない。

具体的な処理としては、我々の言葉をなしているそれぞれの音について、対応する実際の声を集める。それを機械に学習させる。それを延々と繰り返し、そこで得られた「音の連なり」が今度はどういった単語の列に対応しているのかを見極め、あてはめていく必要がある。「なんだ、じゃあたくさん登録すればその分精度がよくなるんだ!」と思うだろうし、その通りの側面もあるが、単純に増えていくと今度はパターンマッチをするための困難さが立ち上がってくる(数千程度の選択肢だったらすぐ終わるが、何万、何十万といった類似例の中から探すのは時間がかかる)。

その次にイタチたちはカメレオンの村にいき、言葉のわかるロボット、通称レオンちゃんと遭遇する。レオンちゃんは「元気?」と聞いたら「元気!」というように、こちらの言ったことに対してそれっぽい返答をするが、メロンちゃんには「大量の会話データの中から今の状況と近いものを探して、返答する」という機械学習を用いた手法がモデルとして用いられている(女子高生AI「りんな」もこのタイプ)。

第三章では質問に答えるロボット(答えのタイプの分類をあらかじめ持ち、質問から検索用キーワードをつくり、答えを検索する)、第四章では機械がどのように画像認識を行っているのか(ここでディープラーニングの解説が入り、以後イタチたちのロボット作りに用いられるようになる)、第五、六章では文と文との論理的な関係をどう機械に教え込むかの話で、第七、八章では単語の意味と、話者の意図をどう推測するのか語られる。最初の方で書いた「恋人を探しているんだ」問題もこの一つ。

果たして、ディープラーニングなどあらゆる技術を駆使しながら、いったいどこまでイタチたちは「言葉の分かるロボット」を構築することができるのか……働きたくないといっているのに無茶苦茶働かされているイタチさんたちなのであった。

おわりに

言葉の聞き取り、おしゃべり、質問への精確な返答、言葉と世界の関連付け、論理的な関係の習得、意味と意図の推測、どれ一つとっても完璧にできた人工知能はいまだ存在しない。それどころか、将来的にできるようになるのかもわからない物ばかり───だが、少なくとも本書は、"なにができないのか"、"なぜ出来ないのか"といった「言葉を理解したといえるために必要な、具体的なハードル」を提示することで、言語処理における現在地の輪郭をくっきりと描き出している。

小学生ぐらいの子供から大人まで、「言葉」について興味のある人たちへオススメの一冊だ。