基本読書

基本的に読書のこととか書く日記ブログです。

最適な中間を探す旅『インフォメーション: 情報技術の人類史』

500ページを超えるなかなかの大著だが、それだけの価値はある。

情報なんてそこらへんにありふれているもので、すごく身近な存在というものですが実際に「情報ってなんなの」ってことを厳密に説明してくださいと言われると難しいことに気がつくわけです。「情報ってのはね、たとえばいまこうやって話していることも情報なわけで、うん、つまりはこういうのが情報なんだよ」ということはできるが、なんだかよくわからない。とくに、科学で扱うにはこんな定義では不十分である。

たとえば──遺伝子だって情報である。こうして今まさに書かれ続けている文字の羅列も情報であり、0と1の羅列だって情報である。アルファベットを符号とし、六十億ビットで人間一人が構成されている。経済だって情報であり、物質から今まさに情報量へと経済の本質が移行しつつある。仮にそれが物質であったとしても、それは誰が何を保有しているのかという、情報だった。

情報を真に科学的に幅広く使用に耐えうる客観的指標として使うためには、そうした例すべてに耐えうる定義が必要になった。

たとえば「運動」は「情報」と同じく、元々はよくわからない単語だった。多くの意味が「運動」にはこめられていて、説明自体は簡単にできてもそれを科学として表現、使用することは出来なかった。科学として使用するということは誰が、どのように使用しても変わらぬ結果を約束できるということだ。桃が熟すこと、石が落下し、子どもが育つこと、すべて運動だった。

自然哲学者らが”運動”や”エネルギー”といった言葉に具体的な意味付け、数式化をおこなって、意味の純度をあげ、誰もが共通して使用出来る客観的な尺度を持った自然観の土台することができるようになったわけで、こうした過程が情報理論にも必要とされるように成ったわけだ。本作『インフォメーション: 情報技術の人類史』はシャノンの理論を中心にして、情報の定義の歴史をおっていこうという野心的な一冊。

なぜなら情報は今ではiPhoneに、iPadに、時刻表にあり、加工手段もさまざまに、並べ替え、同時再生し、解析し、圧縮し、とあるけれど、情報自体はずっとむかしから存在していたのだから。ある日文字がうまれて、あるひ情報を科学的に定義できるようになり、そして今や情報はそこら中にあふれかえって「情報の過負荷」ともいえる状況に陥っている。

本書の第一章はトーキング・ドラムからはじまる。太鼓はおもに突撃、撤退、集合などの簡単な意味を伝えるためにつかわれていたが、実はその一方、少数民族たちは1800年頃、ドラムを叩くことで修辞的文章を湧き出させ、情報を伝えていた。たとえば出生告知をやけに複雑な文章で伝えている。「茣蓙が巻かれ、われらに力みなぎり、ひとりの女が森より出て、広々とした村にいる。さしあたり、これ以上望むものなし」

いっけんこうした修辞まみれの文章はとても無駄なように思える。ただしこの時代、ドラムを叩く以上に早く伝達される情報通信の技術はなかった。徒歩や馬にのった人間がメッセージを伝えるより圧倒的に早かったのだ。これと似た技術がモールス信号になる。とん、つーつーのように短点と長点で意味を伝える。

たとえばAだったら「・」Bだったら「・ー」のようにすれば容易く意図を伝えられる。ただしこれらはアルファベットのかわりであり、ようするにいったん文字を経由してまた別の信号に置き換えている。しかしトーキング・ドラムを使用していたアフリカの人たちは、書き文字を持たなかった。だからかれらはモールス信号とはまったく別途の情報伝達手段をつくりだしていたのだ。それがトーキング・ドラムだった。

かれらのトーキング・ドラムはまったくちゃんと定義されていなかったので、情報が抜け落ちひとつの表現が複数の意味につながってしまうようになっていた。たとえば高音の開口部を二回叩けば父、サンゴ、月、鶏、魚の一種、と。それだけでは意味がわからないので、文脈を不可したのだ。ようは長ったらしく修辞的な通信は文脈をつくることで意味の判別をしやすくするためであり、ちゃんと意味があったのだ。

そしてこの「情報に冗長性をわざともたせて、情報が損なわれても最終的には相手に伝わるようにする」という通信の手法に関しては現代の通信にもいかされていて、僕らのネットや通話が途切れずに伝わるのは冗長性が持たされているからでもある。過去から連綿と受け継がれてきた情報の通信手段だが、これを理論化したのがシャノンだった。

情報理論の父と呼ばれた男で、情報における通信、暗号、データ圧縮や符号化といったまさに今つかわれている定形の基礎を築いたのだった。本書では何度もこのシャノンはとりあげられ、常に核となって存在している。たとえば彼が提唱したのが『メッセージの意味は一般に重要性を持たない』ということだった。

これだけ読むと何を言っているのかよくわからないが、ようはやり取りをする時という意味ではなく、情報を理論として扱うときに「意味」にこだわっていても意味が無いということだろう。とん、つーといったモールス信号もどんどんかっというトーキング・ドラムもThis is a pen! も共通の土台に載せるためにはひとまず意味を排除し情報を定義しなおし必要があった。

シャノンによれば情報は不確実性、意外性、エントロピーだという。可能な送信メッセージが1つだけである場合、そこには不確実性はなく情報はない。英語にはあるアルファベットのあとに続く確率がだいたい統計的に出されており、たとえばtに続く文字はhの可能性が高い。そしてその通りになった場合、意外性はなく情報はあまり伝達されない。

また010101010と延々と続いていく文字列と010010011100101とランダムに記述が続いていく01が、まったく同じ数だけあったとした場合。それらは同一のビット数だが、前者に関しては01を◯回続けよと命令するだけで情報は圧縮することができる。どれくらい乱雑かという問いはそのままどれくらいの量の情報かという問いにこたえることができる。

情報をから意味をひとまずとりさって、数量的に扱えるようにしたのがシャノンの功績だったといえるだろう。先ほどのトーキング・ドラムでみたようにシャノンはメッセージを遠くまで通信させるために、誤り訂正のための余分な記号を使って雑音を克服する方法を考察するなど、今にまで残る理論の基礎をほとんど独力で創りあげたのだから恐ろしい男だといえる。

誤り訂正の理論は符号化理論といって、これがなければコンピュータ科学はなかったといってもいい。モデムもなければ、CDも、デジタル・テレビもなかっただろう。ほかにも未来のコンピュータ設計の基礎として、必要不可欠な理論をいくつか記している。はじめて総当りではないチェスのプログラムを発表したのもシャノンだったのだ。

その後のコンピュータ史はこちらに詳しい。はじめにコマンド・ラインがあった『チューリングの大聖堂: コンピュータの創造とデジタル世界の到来』 - 基本読書 コンピュータが一般的になって、その後どうなったかは僕らが経験している通りだ。信じられないぐらい大量の情報が保存できるようになり、日々Twitterでは大量に文字列が流れていく。

かつて情報は生み出された後はそのうち消えるものだった。文字がなければ話した先からきえていく。しかし文字がうまれ、石にきざみこまれる。紙がうまれ、紙に記載されるようになる。映像化がうまれ、音楽も保存できるようになり、いろんなことが記憶できるように成った。だんだんと情報が残るようになってきたのだ。

情報が多すぎて、それゆえそのかなりの部分が失われる。索引のないネットサイトは、図書館の誤った棚に置かれた本と同じく、忘却の淵にある。だからこそ、強力な情報経済事業の成功例は濾過と検索を土台にしている。ウィキペディアでさえ、そのふたつが組み合わさったものだ。つまり、おもにグーグルが駆動する強力な検索、そして真の事実の収拾と誤った事実の排除に努める大規模な協同フィルター。検索とフィルタリングこそ、この世とバベルの図書館を隔てるものにほかならない。

今のネットの動きは「行き過ぎた情報の氾濫」をなんとかしてどこかで押しとどめようとするものにみえる。グーグルの検索がその代表例だが、NEVERまとめやTogetterのように、雪崩のように押し寄せてくる情報をなんとかしてまとめようとする涙ぐましい努力がある。かつて記録されなかった情報は今では記録されすぎるようになった。

トーキング・ドラムだって、修飾が多すぎれば何を言っているのかさっぱりわからなくなってしまうであろうに違いないことを考えると、情報があまりに多すぎる状況では僕らも何を取得したらいいのかがさっぱりわからなくなってしまうのは自明なり。よって僕らは今、その最適な中間を探す道程の中なのだろう。

インフォメーション: 情報技術の人類史

インフォメーション: 情報技術の人類史