はてブのタグによるグラフ構造についての一考察

風呂に入りながら、「はてブの視覚化」とかしたらおもろいなーっと考えてたのだけど、
どーも、ブクマされている各ページをノードとして考えるとうまくいかない。というのも、各ノードから出ているアークの数って単純に付けられてるタグの数になってしまうわけで。
んー。と悩んでいたら、ひらめいた。タグをノードにすればいいんだ。


タグをノードにすれば、各ブクマされているページをアークとして接続関係を見出して、タグ間の関係が見られるはず。
そうなると、今日一日でよくブクマされたタグとか、このタグと一緒にブクマされたタグってのは簡単に導ける(タグ数×タグ数の行列を作って、そこに全てのブクマを舐めていきつつ、リンクの数を足しこんでいけばよろしい)。
さらに凝ったことすれば、行列をガチャガチャして(グラフ理論とか詳しい人いないかな?)、タグのクラスタリングとかしたり、行列の要素の値の大きさによって色の濃淡を変えて可視化とかできる。
あとは行列の時系列変化を分析するとか。


Kikkerのおかげで、2日間でブクマされたエントリは全てDBに入っているので、それを使えばすぐできそう。
そのうちやってみよっと。


ってか、コレをネタに「SBMのグラフ構造によるトレンド分析」とか論文書けそうじゃない?。誰か書いて。

すでにこういうのあったりしないよね(´ヘ`;)?(投票)