これは素晴らしい。知能と呼ばれるあやふやな概念に対しての工学的な定義、作り方を教えてくれる一冊。人間は物をみて、言語を学ぶ時に様々な機能を使い概念を理解し区分けし、人間同士の会話の中では文脈を読み曖昧な表現を自分なりに解釈するというなかなかにハードなことをやっている。そうしたプロセスをロボットにも全く同じように行わせることができるだろうか。もちろん今まではそれに対する答えは明確に「NO」だったが様々な分野で技術が進展した結果アプローチとしては幾つもの解が与えられるようになってきた。
本書はそうしたロボットが人間と同じような認知、言語コミュニケーション能力のプロセスを獲得していく上で「何が必要なのか」「どんな方法がとりえるのか」「どの程度の精度で可能なのか」といったことを一つ一つていねいに教えていってくれる。僕はこの分野についてはまるで素人だが、素人にも最大限わかりやすいように配慮されており、「今のロボットはここまでできるのか」という驚きと、「人間の認知プロセスはこうつくることができるのか」という自分自身への驚きを体感させてくれr。
構成論的アプローチとは何か
本書で紹介されているような「実際に人間と同じ機能を持つロボットを作ってみよう」というやり方は構成論的アプローチと呼ばれる。大雑把にいえばある対象がどういう構成要素で、どういう機能を持っているのかを調査していくのが分析的アプローチ、たいして実際に自然システムのある側面を人工システムによって複製してみようというのが構成論的アプローチである。
しかしなぜそもそも別のシステムで置き換えるなどと厄介なことをしなければならないのか。当然ながら利点がある。人間の脳というものは厄介なことに様々な機能を持っているがゆえに、言語獲得ひとつとりあげてもその複雑な機能のどの部分が貢献しているのか、正確によりわけるのは困難だ。たとえば犬と猫をみて、同じように四足で尻尾が生えていて毛が生えているという共通の特徴を持っているにも関わらず人間はそれらをすぐに猫と犬にわけることができる。
それらを人間は一体全体どうやってわけているのだろうと言われても、答えを出すことが困難であることはわかるだろう。ところが今回のロボットの件のように、人間の挙動にたいしてこのように動いているのではないかという仮説を立て、仮説をモデル化し、それが実際人間と同じように機能するかどうかを見ていくことで本当に必要な機能だけに削ぎ落とされた理論になる。
実際、今のロボットはどれぐらいのことができるのか
それじゃあ実際に、今のロボットはどれぐらいのことができるのだろう。まず最初の問いは先ほどの「犬や猫をロボットに概念的に区分けできるのか」からはじまっている。これ、シンプルに「できない」と思っていたんだけど意外なことにできるようだ。可能にする方法としては、クラスタリング手法のうちの一つ、K均法が考え方のもとになっている。
詳しく説明すると長くなってしまうので省略する。基本的な考え方は複数の特徴を数値化し(犬と猫だったら鳴き声、重さなど)、座標軸上に数値化した結果を配置し、暫定的なクラスタ分けを行ったあと、暫定クラスタ内で平均値をとって、再度クラスタ化⇒再度平均値の取得のプロセスを繰り返し何度も行い、平均値を更新させながら自動的にカテゴリ分けをさせようという手法がK均法という。
これをロボットでやった例が本書では紹介されている。視覚、聴覚、触覚情報などを統合させて、K均法とは違い確率モデルに基づくクラスタリング手法であるというマルチモーダルLDAを使ったやり方だ。この手法を使うことでぬいぐるみやおもちゃのマラカス、スポンジのボールといった子供用のおもちゃを、ゴム製の人形とふわふわしたぬいぐるみの視覚情報だけではわからない違いを触覚情報によって見分けるなど、かなり正確に分類することに成功している。
さらに上記の実験ではカテゴリ自体は既に与えられたものだったが、これをロボットが自動的にカテゴリーを追加できるようにした別の実験(人間にとっては10カテゴリにわけられる日用品をロボットに読み取らせる)では、触覚や視覚で分けやすいものが選ばれていたとはいえ、人間と同様に10カテゴリと判断することができた。まだまだ不完全ではあるものの外部からの学習なしに自律的に人間と同じような認知に辿り着いた一例といえるだろう。
言葉を学ぶ知能
この他にも形態素解析を用いた言葉を学ぶ人工知能の手法についてもいいところまで進んでいるんだなあと驚かせてくれる。いま何ができるのかというと、『不思議の国のアリス』の原文から単語の区切りを表すスペース記号を抜いた状態で、人工知能はほとんど元の文章と変わらないレベルで、本来の単語の区切りを推定できるのだ。つまりこれは単語の区切りがどこになるのかを推定するのに足る情報が、文章の中にすでに潜んでいるということになる。
もちろんこうした単語の区切りにも考えつくされた単語推定方法を用いられ、積み重ねられた末の結果である。こうした一つ一つの仮説と実践がすなわち「人間がいかにして言葉を学んでいくのか」「人間はいかにして状況をみて概念を分割しているのか」といったいわゆる「知能とはなんなのか」「意識とは何なのか」といった、長年問いかけられてきた根本的な疑問に近づいていくものになっている。
ロボットをつくり人間を模倣していく過程がそのまま、人間が持っている意識の特異性とはなんなのかという人間発見の過程になっている。これは最初に書いた「構成論的アプローチ」を繰り返し言っているに過ぎないけれども、読み終えた時にはこの言葉に対する印象が一変しているはずだ。工学的に知能を再現するということは、人間が自分たちだけの能力だと思って曖昧になっていた部分、たとえば「あれとって、これとって」や「気心が通じ合う」といった概念に情報理論的、数理的な仮説が与えられるということである。
なんというか僕はこの本を読んで、自分がやっていることや日常行われているコミュニケーションのあやふやだった内容が非常に明快に、クリアになったような、気持ちのいい気分を味わっている。そうか、自分がやっていたことはモデル化するとこうなるのか、というある種の発見みたいなものだ。歩いている人間がなぜ自分が歩けるのかわかったような感じ。このアプローチはまだまだ「人間の意識とは何か」という重要な問いへの答えそのもの自体はまだ得られる段階にはないが、少なくとも意識をどう定義したらいいのか、意識に対してどのようなアプローチをとっていけばいいのかという、大きな見取り図を与えられる段階にきていることを教えてくれる。
ロボットの認知メカニズムだけでなく、人間存在への理解に迫る素晴らしい一冊だった。あと読み終えてから気がついたけどこのビブリオバトル本の著者の方でもあった。そういえばあの本を読んだ時、ああ本職は理系の人なんだなあルール設計が工学的な発想っぽいと思ったのだった。紹介記事はこちら⇒ビブリオバトル 本を知り人を知る書評ゲーム (文春新書 901) - 基本読書
記号創発ロボティクス 知能のメカニズム入門 (講談社選書メチエ)
- 作者: 谷口忠大
- 出版社/メーカー: 講談社
- 発売日: 2014/06/11
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る
コミュニケーションするロボットは創れるか―記号創発システムへの構成論的アプローチ (叢書コムニス13)
- 作者: 谷口忠大
- 出版社/メーカー: エヌティティ出版
- 発売日: 2010/03/29
- メディア: 単行本
- 購入: 1人 クリック: 5回
- この商品を含むブログ (7件) を見る
- 作者: 谷口忠大
- 出版社/メーカー: 文藝春秋
- 発売日: 2013/04/19
- メディア: 新書
- この商品を含むブログ (14件) を見る