2006-11-18

貼りたかっただけです

　　　　./＼＿＿_／ヽ　
　　　／　 _ノ||||ヽ､_　 ＼　　ご主人様・・・・・・リセットボタン押して
　 ／ oﾟ(（●）) (（●）)ﾟo ＼ 　　　ごめんなさいだお・・・・・
　 |　三　　（__人__）　三　 |
　 ＼　　 　 ｀ ⌒´ 　 　 ／



　　　　./＼＿＿_／ヽ　
　　　／　 _ノ||||ヽ､_　 ＼　　もう・・・もうしないから許してほしいんだお・・・・
　 ／ 　oﾟ⌒　　　⌒ﾟo　 ＼
　 |　三　　（__人__）　三　 |
　 ＼　　 　 ｀ ⌒´ 　 　 ／



　　　　./＼＿＿_／ヽ　
　　　／　⌒　||||　⌒ ＼
　 ／ 　（ ○）三（○）　 ＼　　ウソに決まってるお
　 |　三 ⌒（__人__）⌒三　|　　　今度はカートリッジアタックでバグらせてやるお！
　 ＼　　 　 r┬-| 　 　　／
　　　　　　　`ー'´

2006-11-18

Kookleのデザインをいじった

ロゴとサイトのデザインを某検索エンジン大手のY社っぽくしてみた。

Kookle-SBM情報より自動生成するディレクトリサービス-
http://www.coins.tsukuba.ac.jp/~i041184/distribute/tag_directory/top_page.html

うーむ。なかなかいい感じ。

2006-11-18

KookleのTODO

http://www.coins.tsukuba.ac.jp/~i041184/distribute/tag_directory/top_page.html
時間があったら、これからは以下のことをやっていこうかなと思う

より自然な階層構造の実現
- 真っ当にタグの共起頻度から求めるアルゴリズムを改良する
- 前(http://d.hatena.ne.jp/kanbayashi/20061111#p3)に述べたように、Yahooとかで語の一般度を調べてみる
- シソーラスを手に入れて、タグの共起頻度と組み合わせる。

ってな感じ。
特に３つ目は、それぞれ片方だけでは駄目な点をカバーしあえるミラクルソリューションじゃないかと個人的には思ってる。*1

情報発信元URL抽出の精度向上

情報の発信元URLごとにブクマ数をカウントするので、そのURLの抽出が正しくできないとだめ。
ex)
http://d.hatena.ne.jp/kanbayashi/20061111#p2　→　http://d.hatena.ne.jp/kanbayashi

現状は、自分が適当に考えたヒューリスティクスでエントリのURLを削ってるだけなわけだが、たくさんのエントリのURLを溜め込んでいけば、一致部分などを考えることで、より妥当なURLを抽出できると思う。

ってか、こんなことできるAPIってどっかで提供されてないのかな？Bulkfeedsとかでさ。

利便性の向上
- タイトルを全てちゃんとつけるとか
- 要約文を付
- タグ検索ボックスね。
- クローリングを定期的にやって、その結果をインクリメンタルに反映
- 各URLにつて、総タギング数を考慮した各タグについてのタギング数の正規化(GIGAZINEのような有名サイトはどこにでも出ちゃってる)
- はてブの各URLのエントリページへのリンクを置く