KikkerのTODO

たまってるものを吐き出してみる

・説明をもっと分かりやすく(画像を入れて)
キーワード登録のもっと詳しい説明
・ソート基準を選択可能に
RSSのリンクの更新日時で、複数のリンクを何度か別の時間で表示してしまってる(クロールが重なってしまっているせい)
・urlとタイトルの対応関係の解決(同じurlで複数のエントリがある場合)
firefoxRSSが化ける
・ブックマーク数を人数によって色を変えるように
・最初の登録では値の入力はしなくていいように
・キーワードを表示する時にそのキーワードがどれだけ重要かによってソートできるようにする  
・キーワードを表示する時にそれのtfidfの値を表示
・クロール時に算出したtfidfの値とYahooへのアクセス結果をキャッシュして再利用

・閲覧したユーザーのベクトルをページの情報に何らかの形で足し合わせたらどうか
・ベクトルを自前で解析するようにして、全ての要素とその重要度をベクトルへ。
ソーシャルブックマークの優位性を説明して情報の良さを理解させる
・選んだページに似ているページも一覧で出せるようにする
ceek.jpの分野判別を使って、分野別でかつ自分にお薦めのページを表示できるように

・エントリを削除した後にクロールしてあったら同じエントリが複数回出現してしまうのじゃなかろうか
キーワード登録で漢字がうまく通らなかったり、ダメでもF5押すと通ったりと不思議な挙動をしやがる
・できればアルファベットのキーワードをちゃんと大文字小文字の情報を持ってDBに入れたい
・検索時にひらがなとカタカナだとErrorが返る時がある?
Amazonのリンクには自分のアフィリエイトIDを付加

・ユーザー登録した時のリンクのアドレスがおかしい
WindowsFirefoxで正しく動いてない
・ニュースでキャッシュが効いてないんじゃないか疑惑
・未知語にボーナスを設定
・HTTPヘッダでリダイレクトさせると早くなる?
・登録情報再編集でどわーって出てきたのを登録しようとすると駄目→たぶんバッファのサイズ
・キーワードの個数を制限しなくちゃ(閲覧時にソートして足きりするとかしかなさそう)
・エラーページのデザインとリダイレクト
・評価値の決め方を、類似度でふるってから、それらをブックマーク数でソートする、という方式にしたらいいかも

・類似度の高いユーザーからベクトルを分けてもらう(突然変異機能)とか付けてみる?
・ユーザーが見たページを記録できるのを有効活用しなくちゃ


努力目標
Youtubeの動画をSuggest
・横軸にユーザー,縦軸にキーワードというようにして疎行列をつくればうんちゃかほっちゃかして、関係ないページでもSuggestできるのか?
APIを公開する
・DBの中身をcsvファイルとして持っていけるように
・キーワードベクトルの入力を補完するなり、何かいい方法を。
はてブのキーワードとかタグを学習して、キーワードを絞った方が良さそう
・表示するデータを何時間前からで指定できるように
・各リンクの横にそのサイトの趣向ベクトルを見られるようなボタンを用意
 (はてブからのやつはいらなくね?)
・表示するデータをある程度の量で区切る。
・リクエストの前にユーザーごとに返すためのドキュメントを生成しておく
RSSを各項目ごとに分ける
はてブRSSから持ってくるようにしてDescriptionも表示
・文書量,画像の量なども判断の基準に