午後〜夜〜夜中-コラボレィティブフィルタ改良-

とりあえず、昨日の段階で動くものはできてたんだけど、普通のコラボレィティブフィルタのアルゴリズムだと推薦される結果があまりよくない。
というのも、HotEntryに出てくるような大量ブクマされエントリばかりが推薦されちゃうのね。
んー。これが総意と言えばその通りなのだろうが、これだったらHotEntry見てればいいじゃんって話になってしまう。


さて、どうしよう。
んー。と小一時間ほど悩んだらひらめいた!!。
あるエントリの評価値を求める時に、(自分に似た人達の中でのブクマ比率/全体の中でのブクマ比率)で重み付けしてやればいい。
こうすれば、全体でよくブクマされているようなエントリなら1倍。自分に似てる人たちの中でだけブクマされているエントリは1倍より大きくなる。
これでボーナスを設定したら、宝物が上に上がってくるはず。


カチャカチャ。実行。うぉぉぉ。思ったとおりだー。自分で言うのもなんだけど、俺賢ぇーーーーーーーー。


ってなわけで、うまくいきました。


その後は、できたのをWebで使えるように組み込む作業。オワラネ( ・_ゝ・)

計算量が多すぎるのはどうしよ(投票)

Today's (hoge)^2

  • sta la sta - はてブの「お気に入り」に入れる人をGooglePageRank的な評価で探してみるのはどうかな

http://d.hatena.ne.jp/starocker/20060822/p1
へー

http://d.hatena.ne.jp/anonymous_d/
Blogを掲示板にするなと。ってか、複数人で編集とかできるんだね。

  • はてブのタグによるグラフ構造についての一考察

http://d.hatena.ne.jp/kanbayashi/20060808#p5
で書いたことなんだけど、これと同じような事をバスケット分析というやつでできるらしい。
[参考]
http://www5.ocn.ne.jp/~shinya91/csm/41csm_faq.html#basket