時間という無慈悲な作用
ページランクという初期の Google を差別化した秀逸なアイディアは、エンタープライズサーチの世界ではあまり役立たない、という話を聞きました。確かに、普通の文書ファイルにはリンク構造が記述されることは多くないでしょう。なので、ページランクの算出はそもそも無理な試みです。
ではどうやって、ページランクなしでページランクと同じように、より価値のある情報を検索結果の上位にランキングすればいいのでしょう? もちろん、同等ではなく、ページランク以上に有効でも構わないわけですが...
アクセス件数は情報の価値を間接的に表現している可能性があります。また、時間の経過に情報の価値は影響されるということは、多分、間違いないでしょう。このことを何とか利用するアルゴリズムはないものか、なんてことをボンヤリと考えてみたりします。
例えばニュースの価値は、その鮮度が高いほど、つまり最新のニュースほど価値があるはずです。またそのニュースを購読・視聴した人の多さが関心の高さを表すはずです。1ヶ月前のニュースを今になって読みたいとは、普通は思わないでしょうから、結果的にリリースされた直後と1ヶ月後の今では、そのニュースを読む人数は比べものにならないでしょう。時代考証的な資料的な価値が、古いニュースに発生したりという特殊な事情は、ここでは無視しておきます。
一方で、ニュースとは全く別の価値評価が成立する情報もあります。
先日、「星を継ぐもの」という本を購読した結果、Amazon から「夏への扉」というSF 小説をリコメンドされました。SF について無知な私は知らなかったのですが、それは1950年代に発表された SF の古典的名作で、読んでみると、今となっては古びた内容もあるものの、なかなかどうして面白いものでした。
例えばこの「夏への扉」のように、時間の経過に風化せずに、読者を惹きつけ続けている情報も存在します。
つまり、鮮度という評価要素は重要であるものの、逆に鮮度が落ちてもアクセスされ続ける情報は、別種の価値を保持していると判断できるということです。
下図のようなイメージです。
さてと。
これをちゃんとモデル化して、必要なメトリクスを採集する仕組みを構築して、となるとお手上げなんですけど...
しかも、後から振り返って分類したい訳ではなく、ある瞬間において判断できなくては意味がありませんし。
- Category(s)
- Google様、Amazon様
- The URL to Trackback this entry is:
- http://dev.ariel-networks.com/Members/takatsuka/664295933068304430467121614860b2306a4f5c7528/tbping