読者です 読者をやめる 読者になる 読者になる

基本読書

基本的に読書のこととか書く日記ブログです。

見えない場所で起こり続ける攻防戦──『スパム[spam]:インターネットのダークサイド』

HONZ掲載 科学ノンフィクション

スパム[spam]:インターネットのダークサイド

スパム[spam]:インターネットのダークサイド

  • 作者: フィン・ブラントン,生貝直人,成原慧,松浦俊輔
  • 出版社/メーカー: 河出書房新社
  • 発売日: 2015/12/25
  • メディア: 単行本
  • この商品を含むブログを見る
長い間迷惑メールに煩わされていたが、最近はフィルタ機能のおかげでそうでもない(挨拶)。たまに防壁を逃れてやってきたやつをベシベシ叩いて削除するぐらいになってしまったが、当然防壁には防壁のロジックがあり、逃れてくるやつには逃れてくるだけのロジックがある。見えない戦いがそこでは常に起こっているのだ。

本書『スパム[spam]:インターネットのダークサイド』は、そんなスパムの裏側に迫った一冊だ。『スパムの歴史はコンピュータネットワーク上に集まる人々の歴史の裏返しである。なぜならスパムの計略は人々を標的とするからだ。』という言葉通り、スパムは一部の軍関係者と研究者のみが触っていた時代から存在し、その後も形態を次々と変え、現在もインターネットと密接に結びついている。

形を変え続ける概念を定義することは物凄く難しいことであるが、本書はスパムの歴史を追うと同時に、本質的に困難なはずの「スパムの定義」にまで踏み込んでいく。普段「防壁」が何をやっているのか意識しないが、そのロジックは人間の思考力が費やされたなかなか素晴らしいものだ。逆に、その防壁を突破しようとする側も人間で、依然としてスパムはそこら中にばらまかれているのだからそれなりの「利益」もあげているわけである。その為には結構バカバカしいこともやっている。

スパムについて知ることの何が面白いって、インターネットの発展と共にその姿を変化させていく歴史や、実際にどのような手法を使うことでいくら儲かるんだろうという単純な疑問への答えもさることながら、そのようなスパムを仕掛ける側と防衛する側の高度ないたちごっこがたまらなく魅力的なのである。

不毛ながらもそこには人間の知性がある。

もっといいのは振り込め詐欺メール──先に述べた「ナイジェリアのスパム」──で、これは二〇万通のメールに対して二〇ドルかかり(……)、二パーセントか三パーセントの返信率で、被害者一人あたり一九二一・九九ドルの収入がある。スパム業者が本当に大きな獲物を狙わなくても、仕事の量は増えるが、最終的に二〇万ドルの利益を達成することが予想できる。

どのような攻防があるのか

たとえばメールの振り分けについて。

ベイズ分類プログラム──スパムメールと非スパムメールをそれぞれのフォルダに振り分けることによって、両者のメールに存在する特徴的な語彙差を学習し続け仕分けを行う──は有効ではあるが、万能ではない。正当なメールと判定されたスパムメールを削除するのは人間には大した手間ではない(逆はコストが高い)為に、フィルタは基本的には「少し間違うことはあっても許容できる」側に傾けられる。

その穴につけこんでスパムを送る側は幾つもの対抗策を行う。たとえばもっとも単純なものでは、「さらに大量に送りつける」。あるいは、振り分けられることを前提とした文章、振り分けを突破するような文章をつくることである。

これがなかなか面白い。

1.理論的には、スパム的な言語とともに自然で受け入れられる単語をメールにたくさん入れ、メールがスパムメールではないと判定される確率を上げることによって、フィルタをくぐり抜けることができるだろう。リンクのない、わけのわからないメールはこのアイデアの試験装置だった。何がはじかれ、何が通過するかを見るために、無数の変種が送信された。「私はでも/実際に食べものをつまらせ、いつも戦争のラッパ/が響いた! この不動は蛇の毒を塗った投矢をする、/私は笑ったことだろう」。

このようなメールがいったんくぐり抜けてしまうと、今度は受信者側にジレンマがやってくる。スパムと分類せず削除したら正当なメールとしてプログラムは受け取り、逆にスパムに分類した場合、スパムに判定される一般的な無害な単語への警戒度が無意味に上がって判別制度が落ちてしまう。

そもそもスパムとは一体何なのか。

そもそもスパムとは、スパムメールの事のみを意味しない。本書では様々なスパムの形をみていったあとで、スパムを次のように定義してみせる。『「スパム」とは何か。スパムとは情報テクノロジー基盤を利用して、現に集積している人間の注目を搾取することである』当然迷惑メールは注目を搾取するからスパムだ。

他にも、たとえば、SEO対策が優れていて検索順位の高い無内容なサイト。「注目を搾取するからスパム」というのは単純だがなかなか奥が深い。これをもう少し考えると、疑問が次々に湧いてくる。ハフィントン・ポストはAOLによって買収されたが、これはAOLが大量コンテンツが生産され集積し、人々の目が集まる場所を買ったのであって、これは不当に注目を搾取しているともいえる。

はてなブックマークには数を集めることで「人気エントリー」という、注目の集まる場所へとサイトを誘導する仕組みがあるが、わざと身内に頼んで(あるいは頼まなくてもそういう空気をつくって)「人気エントリー」に挙げてもらう人間もいる。これなんかは「注目の搾取」そのもの、つまりスパムだ。

代表的なものとしてまず「迷惑メール」の例をとりあげたが、最初に書いたように「インターネット──人間がいるところにスパムあり」なのである。迷惑メール対策と同様、スパムを規制しようと様々なことを試みるが、それを突破しようとする攻防はどこでも起こっている(はてなも何かやってると思うが、僕は知らない)。

検索システムでいえば、記事の質を判定するような仕組みだ。しかし現代では、利益が出るラインを計算するアルゴリズムに基づいて、人間の書き手にコンテンツを依頼したりする。そうすれば、単純な判定はもはや不可能である。ブログなどの会員制システムをプログラムで自動取得されないように文字認識を導入しているところは多い。これも要するに、「あなたは人間ですか」と問いかけているわけだが、時にこれを突破させる為だけに雇われている人間がいるのだという。

 この気の毒な人々の仕事は、通常のデータ入力の仕事さえ、これと比べればきわめて快適にみえるほどで、賃金は基本的に人間であること、つまり理論的には人間であることを明らかにすることに対して支払われている。

ほんとにそんな仕事があるんかいなとちょっと笑った。当然これは極端な例で、「文字認識を正常に行うプログラム」の発展も日々進んでおり、逆に防衛側は「人間にしか出来ないこと=人間を証明させる問い」を日々考えているわけだ。

チャールズ・ストロスが言うように、「一方にはチューリングテストに通れるメールを生成するソフトウェアを書こうとする側、他方にはまにあわせのチューリングテストを管理できるソフトウェアを書こうとする側がいる」。

これはひどい。こんな例と考察が満載で、世にも珍しいスパムの専門書にして歴史の最前線がここにあるのだからずいぶん貴重で面白い本である。一方で、注意しておきたいこともある。めちゃくちゃ読みづらいのだ。最初は翻訳がよくないのかと思ったが、たぶん原文からしてかなりキツイんだろうなと思う。

たとえばこんな文章、言ってることはわかるけど理解するのに時間がかかるしこんなわかりにくい比喩を使う理由がいったいどこにあるんだと思ってしまう。『シュルレアリスム的な自動書記には対応する固有のリズムがあり、バロウズ的なつなぎあわせはその著者が好んだ不快な並置に対する趣味に強く依存する』

最初あまりにも意味がわからなすぎて笑ってしまった。訳注も入っているからそこまでひどいってわけでもないんだが、まあ凄い読みづらいよ。面白い本なのは確かなので、そのへんよろしく。