午後〜夜〜夜中-はてブでコラボレイティブフィルタ-

今年の特別演習は、はてブでコラボレイティブフィルタ*1をしようというのを提案してやることになったんだけど、それについての担当教官とのミーティングが29日にある。
というわけで、そろそろ、夏休みの成果を作らなくてはいけない。じゃないと、「何もやってましぇーん」って言うだけになってしまう。それは困る。


よーし。Let's 実装!!


とりあえず、はてブの新着エントリのページから、一万エントリ分ほどクロールして*2、ユーザとページをキーとする2次元の疎行列を作る*3
そして、コラボレィティブフィルタのアルゴリズムを実装。ネタはバラすと感動がなくなるので、バラさない。もしくは、また今度。


で、テストしてみると、それっぽい答えは一応返ってくる。ただ、アルゴリズムが正しく実装されているのか微妙なところがあるので*4、どうなのやら。
とりあえず、もうちょっと頑張ってみまする。


とりあえず、ちゃんとできたら、Web化して、「はてブおせっかい」とでも題してサービス公開する予定。
こうご期待。


意外とあっさりでけた(投票)


[関連記事]
去年の特別演習のできたやつ

*1:Amazonが他の人達の行動から本をサジェストしてるのもコレ

*2:誰がどのページをブクマしたかね

*3:ハッシュをうまく使って実装

*4:細かいところの理解が曖昧