超えます、超えます
誰が何を超えるのかはともかく、こんなんどうでしょ、というお話です。おまけに、ふと今日、思っただけのことで。
きっかけは世間でのGoogleの人気が凄いなあという感慨です。個人的にもこの数年、Webの検索はGoogle頼りだし、最近、翻訳が出たジョン・バッテルという人の書いた「ザ・サーチ」という本も早速、読みました。
一方で、Googleの凄さの源泉はどこだったのかということが完全には理解できていません。そりゃ今や巨人の風情があってお金持ちとしての凄さはあるとしても、貧乏であった頃から凄かったからこそ、大きく太れたはずです。
ある時点からは、検索対象のカバレッジの広さ、深さがアピールしたのかなと思ったりもします。そういう意味で、より広く、深く、速く情報を収集する技術、しかもその処理と収集した情報の蓄積を安価(相対的に)に実現するための基盤技術が凄いから、というのは一つの答えのようにも思います。しかし、これは検索サービスの装置産業的な匂いを漂わす側面で、あんまりクールには思えません。
そこでやっぱり、Googleの誕生神話として外せないPage Rankというところに話は落ち着きます。
学術論文が引用関係で重要性が評価されていたことを、Webサイトのリンク関係に置き換え、サイトの重要性を自動的に判定する考え方がPage Rankです。Page Rankを検索結果の順位に利用することにより、Googleの検索結果は、利用者にとって有用な結果が上位に表示されて便利となった、ということになっています。
さて、ここから、今日、駅に向かう道すがら思いついたことです。
しばらく前に、ネットワークの科学についての本を読んだのですが(因みにこの「ネットワーク」はIT、情報通信のネットワークではなく、より広義な意味でのネットワークです)、その中に、「エルデシュ数」「ケビン・ベーコン・ゲーム」というのが紹介されていました。
エルデシュというのは放浪し続けた数学者で、ケビン・ベーコンはそこそこ有名な俳優ですね。
「エルデシュ数」というのは、ある数学者が何人の共同研究者を介在させればエルデシュにつながるか、「ケビン・ベーコン・ゲーム」は、ある俳優が何人の共演者を介在させればケビン・ベーコンにつながるかというものです。意外な位、この次元数が低いというのがこの2つの数字の面白さのようです。
その面白さはもちろんどうでもよくって、そうです、もうお察しの通り、この考え方をWebのランキングに使えないものかと思ったのです。Page Rankがどれだけ多くのしかも重要なサイトからリンクされているかで、あるサイトの重要度を判定したのに対して、エルデシュ数的ランクは、特定のテーマに関してのオーソリティ的な重要サイトからのリンクのホップ数でランキングします。
検索のテーマに応じて、エルデシュやケビン・ベーコンの役割のサイトを変えたり、あるいは検索利用者自身が指定することによって、ランキングのスコープが絞られて、検索結果に好影響となるのではないかと想像するのですが。どうでしょう。
え、エルデシュやケビン・ベーコンの役割サイトはどう決定されるのか?
それは、Page Rankかなあ!?
- Category(s)
- Google様、Amazon様
- The URL to Trackback this entry is:
- http://dev.ariel-networks.com/Members/takatsuka/8d853048307e305930018d853048307e3059/tbping
- ¦
- Main
- ¦
- PDFBoxで日本語
グーグルを辞典のように使用する超簡単は方法