研究室-タグ解析スクリプト-

新着エントリを豪快にクロールして、

  • 一緒にタギングされたタグ
  • 指定タグされたことが多いサイト


を検索できるスクリプトを書いた。
#一度取得したデータはマーシャルしてローカルに置いておく感じで
#本当はサービス化したいところだが、自鯖のネットがないので無理ぽ


実行結果はこんな感じ


googleタグと一緒によくタギングされたタグを検索

E:\programfiles_noinst\eclipse3.0\workspace\ruby_work>ruby do_hatebu_tag_research
.rb similar_tag_search google
gmail:52
web:44
広告:30
mail:30
web2.0:28
map:28
youtube:28
firefox:24
news:24
tool:22


lifehackタグならここを見ろ!!なサイトを探す
#エントリじゃなくて、それの発信元。

E:\programfiles_noinst\eclipse3.0\workspace\ruby_work>ruby do_hatebu_tag_research.rb url_search_by_tag lifehack
20tagged http://cyblog.jp/modules/
16tagged http://www.itmedia.co.jp/bizid/
13tagged http://www.ideaxidea.com/archives/
12tagged http://business.nikkeibp.co.jp/article/
10tagged http://news4vip.livedoor.biz/archives/
7tagged http://www.aou.or.jp/douga/
4tagged http://www.future-planning.net/x/
3tagged http://www.kutsuwa.co.jp/goods/
2tagged http://d.hatena.ne.jp/rayz/
2tagged http://tsukihito.dip.jp/kpb/


動作原理は、
http://d.hatena.ne.jp/Marathon/comment?date=20061101#c
のコメント参照