Kookleのディレクトリ構造についての考察

http://www.coins.tsukuba.ac.jp/~i041184/distribute/tag_directory/top_page.html


Ryo考案、オリジナルアルゴリズム*1ディレクトリ構造を抽出してみたところ、Kookleディレクトリができた。
で、個人的には思ったより良好な結果が出たなぁと思ってる。


ただ、一般的な意味の包含(ほうがん?、ほうふくだと思ってたんだけど変換で出てこなかった・・・)関係にはなっていない。
例えば、javaという階層の下にプログラミング言語というタグがあったりするのだが、これは普通に考えるとおかしい。


このような点において、Kookleディレクトリ構造はあまり良質なものではないと言える。
しかし使ってても違和感はあまり感じない。
これはつまり、はてブユーザの頭の中が一般的な階層構造とは違い、こういった階層構造になってて、それを写像した形になってるんじゃないか?と考える事ができないだろうか。


そう、Kookleはユーザに最適化された構造となっているのである。
#と欠点をごまかしてみる。


冗談はさておき、階層構造を一般的なものにするのであれば、現状のようにタグの共起関係を用いるのではなく、Yahooで各タグと、各タグ間のand検索とかをやって、ヒット数を調べて使うとよさげ。
あとは、はてなキーワードAPIとか?←thanks to odzさん


どっちにしても、数万回のオーダーでクエリを送ることになるので、やりたくはないなぁー。

#追記 11/13
同じ過ちを犯している外人をハケーン
More thoughts on tag frequency
http://csabaveres.net/blog8/?p=19

*1:思いついてるけど試してないのがまだいくつかあるよ