http://www.coins.tsukuba.ac.jp/~i041184/distribute/tag_directory/top_page.html
Ryo考案、オリジナルアルゴリズム*1でディレクトリ構造を抽出してみたところ、Kookleのディレクトリができた。
で、個人的には思ったより良好な結果が出たなぁと思ってる。
ただ、一般的な意味の包含(ほうがん?、ほうふくだと思ってたんだけど変換で出てこなかった・・・)関係にはなっていない。
例えば、javaという階層の下にプログラミング言語というタグがあったりするのだが、これは普通に考えるとおかしい。
このような点において、Kookleのディレクトリ構造はあまり良質なものではないと言える。
しかし使ってても違和感はあまり感じない。
これはつまり、はてブユーザの頭の中が一般的な階層構造とは違い、こういった階層構造になってて、それを写像した形になってるんじゃないか?と考える事ができないだろうか。
そう、Kookleはユーザに最適化された構造となっているのである。
#と欠点をごまかしてみる。
冗談はさておき、階層構造を一般的なものにするのであれば、現状のようにタグの共起関係を用いるのではなく、Yahooで各タグと、各タグ間のand検索とかをやって、ヒット数を調べて使うとよさげ。
あとは、はてなキーワードのAPIとか?←thanks to odzさん
どっちにしても、数万回のオーダーでクエリを送ることになるので、やりたくはないなぁー。
#追記 11/13
同じ過ちを犯している外人をハケーン
More thoughts on tag frequency
http://csabaveres.net/blog8/?p=19
*1:思いついてるけど試してないのがまだいくつかあるよ