授業もさぼって寝てた。とりあえず風邪を治すには睡眠だろうということです。
研究室-Kikkerの改善-
今日は
・サイト内の説明文の改善
・Cookie周りのバグの修正
などをしたよ。
チャイニー宅で
シャワー借りた
ユーザー カスタマイズド サーチ の実現可能性
というのをKikkerの将来を考えているうちに思いついた。
http://ryogrid.myhome.cx/wiki/pukiwiki.php?Kikker
というのも、Kikkerの問題として、Suggestされる情報がクロールしてるサイト内のものに限られているというのがあって、現状だとはてブユーザー好みの情報、つまり、いわゆるGeek好みの情報しか当たってこない。
じゃあ、それを解決するにはどうすればいいかって言うと
・いろんなサイトをクロールする
→まぁ真っ当。でもSBM以外にクロールすべきサイトが思いつかない。なんかよさげなトコがあったら教えて。
・検索エンジンを活用
→今回の話
なんてのがあると思う。
で、後者は具体的には
1:Kikker内のユーザーの持っているキーワードでグーグルとかにOr検索をかける。すると検索結果がどわーっ。
2:んで、返ってきた結果をリンクの集まりとして扱って、はてブの時と同じ要領で解析しつつクロール。
3:それらに対して類似度計算してランク付け
すると、あら不思議、ググルさんを使ってユーザーカスタマイズドな検索結果を得られましたよと。
ただ、サイトの解析ってけっこう重いので計算機リソース的には無理かな・・・・・・って思ってたけど、Kikker内のユーザーの分だけならどうにかなるかも(検索エンジンとして公開するのは厳しいだろう)とコレ書いてる途中に気づいた。ニヤニヤ。
まぁKikkerだけの話だったらここで終わりなんだけどもう少し踏みこんで考えてみると、思うに、今言ったみたいなことがデフォルトで可能な検索エンジンってのがあるべきなんじゃないのかなと。
例えば、ググルさんだったら部分文字列一致検索をするためだけのデータとページランクのデータを各ページごとに持ってるんだろうと思うんだけど、それだけじゃなくて、ページ内の各単語の重要度とかいうデータも持っておけば、上で言ったようなこともわざわざ毎回ページの解析しなくてもできるよね。
最終的に(ページランク+検索単語群のページ内での重要度)でソートして検索結果が得られるとしたら便利じゃない?ってか誰か作って。