読者です 読者をやめる 読者になる 読者になる

Paradigm Shift Design

ISHITOYA Kentaro's blog.

佐々木俊尚著、インフォコモンズ、読了

読書

一戸先生のBlogの最近読んだ本/買った本にあって、刈谷のApitaに行った時に見つけて買った本。


インフォコモンズ (講談社BIZ)

インフォコモンズ (講談社BIZ)


ある人が情報にアクセスする際には、必ず「なぜその情報にアクセスするのか」という暗黙的/明示的な背景がある。それを佐々木先生は「情報を軸とした中間共同体」といい、それを言い表す新たな言葉を「インフォコモンズ(情報共同体)」と定義している。
インフォコモンズは、ある人が情報にアクセスする文脈に応じて複数存在しているという考え方。


話の中心は、このインフォコモンズという考え方を、適切に技術が支援することで、情報アクセスに対する人間の能力をきちんと補完することができるようになるであろうという話だった。


僕は、Web2.0とか3.0とかいう話が好きではないので、あまり面白くはなかった。ただ、インフォコモンズという考え方、概念については同意する。


一応僕の専門分野は、セマンティックウェブ周辺なのだけれども、技術的な観点からいうと、この本にはいくらか間違いがある。

セマンティック・ウェブは、ウェブの考え方を発明したことで有名なイギリスのコンピューター科学者、ティム・バーナーズ=リーが二〇〇一年から提唱しているプロジェクトの名称だ。HTMLで書かれている通常のウェブに対し、セマンティック・ウェブは情報の注釈を付け加えたXMLで記述することによって、標準的な形式でウェブに意味を与えることができる。


第3章「信頼」と「不安」を生むシステム 「信頼」と「友情」は対立概念 p122

まず、セマンティック・ウェブは、プロジェクト名ではない。抽象概念である。なぜなら、「セマンティック・ウェブ」の完全な実装などどこにもないからだ。これが本書を通じての大きな間違いだろう。技術的にいえば、HTMLに対してXMLを埋め込むことが、アノテーションの手法なのではない。セマンティックウェブは、すべてのリソースをURIとして定義し、URIURIとの関連付けを主語・述語・目的語の三つ組で表現する手法だ。
また、標準的な形式でウェブに意味を与えること、というのは、機械が解釈可能な形式でというふうに書くべきだろう*1

セマンティックウェブは非常に大きな可能性を秘めているが、ウェブをこの方向に進化させるのはそう簡単ではない。最大のハードルは、すでに存在しているウェブページをすべて作り替えなければならないことだ。
加えて情報アクセスの観点から言えば、もうひとつの問題がある。セマンティック・ウェブはウェブに意味を付け加えることによって、ウェブ同士の関連性をすぐに調べることができるようにはなるが、しかし利用者とウェブの関連性を調べることはできない。
つまりセマンティック・ウェブは、情報と情報の適合性を高めることができるけれども、情報と人の適合性を高めるためには、別の手法が必要になるということだ。


第3章「信頼」と「不安」を生むシステム セマンティックウェブ協調フィルタリングの問題点 p123

前述のとおり、ウェブページをすべて書き換える必要はまったくない。確かに一部のRSSやDublin-Coreメタデータなどには、埋め込まれているが。埋め込むための技術として、XHTMLと親和性の高い、RDF/XMLが開発されたのであって、RDF/XMLRDFの表現手段にすぎない。
もっといえば、セマンティックウェブを実現するためのインフラ技術として、w3cが提唱している標準技術の一つがRDFであって、世の中にはmicroformatsなんかもある。


そして、著者のセマンティックウェブに対する最大の勘違いは、

しかし利用者とウェブの関連性を調べることはできない。
つまりセマンティック・ウェブは、情報と情報の適合性を高めることができるけれども、情報と人の適合性を高めるためには、別の手法が必要になるということだ。

である。セマンティックウェブは、URIとして表現できるのならば、あるいは表現するのならば、すべてのものをメタ情報として扱うことができるし、情報と人を関連付けることもできる。要するに著者はFOAFを知らない。


次に協調フィルタリングが出てくるが、

またパンドラやセマンティック・ウェブのようなアプローチでは、情報の属性を最初に解析し、分類しておかなければならない。パンドラでは、まず膨大な数の楽曲をゲノムに基づいて点数化するという専門家の作業が必要なのだ。
しかし協調フィルタリングでは、ほかの利用者との好みの類似性を見ているため、その情報がどのような内容を持っているかは、考慮しなくてよい。つまり情報を事前に分類するという作業が一切不要になるのだ。


第3章「信頼」と「不安」を生むシステム セマンティックウェブ協調フィルタリングの問題点 p124

協調フィルタリングは、情報がどのような内容を持っているのかを知らないから、トンチンカンな情報をお勧めしてしまう可能性を否定できない。


第3章「信頼」と「不安」を生むシステム セマンティックウェブ協調フィルタリングの問題点 p125

協調フィルタリングは、利用者同士の行動の類似性を見ているだけで、利用者の属性を見ていない。


第3章「信頼」と「不安」を生むシステム セマンティックウェブ協調フィルタリングの問題点 p125

これも、間違いだろう。この文脈では協調フィルタリングも「実装された技術ではなく概念」を指す。だからセマンティックウェブと対立する技術ではないし、比較できるものでもない。
要は、協調フィルタリングが、利用者の属性をみないだとか、情報がどのような内容を持っているかをみないだとか、というのは、単純に「Amazonが実装している協調フィルタリングがそういう実装だ」というだけの話で、一般化できる問題ではないということだ。


その後の話で出てくるゼロスタートコミュニケーションズのzero-zoneという推薦エンジンも、協調フィルタリングセマンティックウェブの問題点を解決するような話になっているが、そうではなくて、これこそ、情報に対するメタ情報を整理して利用可能にするというセマンティックウェブの思想だろう。違うのは、メタ情報の取得をベイジアンフィルタを使って自動化しました。というところだ。


3章から先の話は、この勘違いによって、眉に唾して読むほうがいい内容になってしまっている。
CODEを読んだ時にも思ったが、技術的な話を書くときは、技術屋さんに精読してもらったほうがいい。あるいは構想の段階できちんと確認したほうがいいだろう。


上記の問題点を除けば、インフォコモンズという考え方はわかりやすい。
ただ、僕は、著者のいう「可視化されたデータベース」が、Webのあちら側にあるのではなく、Webのこちら側にあるアーキテクチャをWeb3.0に期待する。CODEでレッシグ先生が「財布のような」と形容したアーキテクチャの個人情報データベースだ。


Safari3.1から導入されている、HTML5 Client-side database storageは、その先駆けになるのではないだろうか。こちら側にあるデータと、あちら側にあるデータが有機的に協調して動作する世界。Chromeは、絶対に実装しないだろうな。


CODEは読み終わったけれど、感想を書くのに時間がかかりそうなので、
27冊目。

*1:機械可読ではなく、機械が解釈可能。機械が理解可能とも違う