2006-06-20

メモ

ControllerのメソッドをViewで使うには
helper_method　XXXXX
とConrollerの頭に宣言

2006-06-20

W-Dで

NIESに会う。で、検索エンジンについていろいろ語らううちに、
Nutchっていうオープンソースの検索エンジンがあるんだよってのを説明してあげたりしてたら、NutchはJava製という事が判明。それもApacheのサブプロジェクトにいつのまにかなってるし。
ほー。
後で試してみよっと。

2006-06-20

並列処理アーキテクチャ

前半の復習。

2006-06-20

情報特別演習のミーティング

今後の方針について決めた。
んで具体的には

1:コラボレイティブフィルタ
2:LSA

という優先順位でやることに。

LSAに関してはSimple PCAという次元圧縮のためのアルゴリズムを教えてもらった。で、これすごいの。高校生でも分かるような単純なアルゴリズムなのに特異値分解するよりずーっと計算量が少なくて、んでもってLSAをやる上では精度もいい。
(　；∀；) ｶﾝﾄﾞｰｼﾀ。
ってかLSAは案外すぐにできそうだなぁ。

話は変わるけどKikkerってEPIC 2014みたいになるんじゃない？って話が冗談として出て、自分は聞いたことも見たこともないので調べてみた。

http://bbnews.jp/archives/2005/09/16/233404.html
http://www.probe.jp/EPIC2014/ols-master.html

内容がリアルでなんか恐い((((；ﾟДﾟ)))ｶﾞｸｶﾞｸｶﾞｸﾌﾞﾙﾌﾞﾙﾌﾞﾙ。こんな時代がそのうち来るのかなぁ。

Googlezonか。今のうちにGooglezonに変わる存在に向かって歩き始めれば世界征服も夢じゃない・・・・・のかもしれない。なんて。

2006-06-20

Java製オープンソース検索エンジンNutchを試す

NutchとはオープンソースのJava謹製検索エンジンです。今はApache Luceneのサブプロジェクト。というわけで、早速試してみた。
http://lucene.apache.org/nutch/index.html

基本的には↓らへんを参考に。
※要シェル(Windowsならcygwinとか)

unokun研究室: nutchインストール
http://www.unokun.net/archives/000016.html
unokun研究室: nutchで自サイトをクロール
http://www.unokun.net/archives/000323.html
Nutch、ナッチ、なっち
http://www.airs.co.jp/blojsom/blog/bigmac/Opensource/2004/08/13/6F30214F784C89C1F220A7AF58FAC896.txt

まとめると

0:http://www.meisei-u.ac.jp/mirror/apache/dist/lucene/nutch/nutch-0.7.tar.gz *1をダウンロードして解凍
1:urls_XXXXというファイル(XXXXは好きな名前つけて)を作って、中身にクロール先のクロール開始アドレスを書く。んでもってNutchの解凍してできたディレクトリの直下に置く。
2:confディレクトリのcrawl-urlfilter.txtを編集。クロールするリンクの条件を書くんだけど、とりあえず