先月末にひらめいったーの総投稿数が1万に到達しました。
http://d.hatena.ne.jp/kanbayashi/20101027/p2
今回は、上のエントリで宣言したように、ひらめいったーの1万エントリへの軌跡を簡単に見てみます。
投稿したユーザの内訳
総投稿数は11/23日現在で9449個、総投稿ユーザ数は1148ユーザです。
投稿数は本当は1万ちょっとになるはずなのですが、運用中のトラブル等で生じたidの付け替えや、システムの不都合で生じたゴミデータの除去などの都合で、一部が歯抜けになり、この数字となっています。
投稿数の内訳は下のようになりました。
グラフは、見易さのため上位30ユーザのみ個別に示しています。
全ユーザ(1148ユーザ)について集計した結果は下です。
https://github.com/ryogrid/distribute/raw/master/hirameitter_user_ranking_all.csv
全投稿のうち、半数以上の77%が上位30ユーザにより占められています。
上位100ユーザでは78%、500ユーザで92%でした。
とりあえず上位3ユーザを見ると、トップは私(@ryo_grid)で1597個 (16.9%)、続いて@hassotoiletで1437個 (15.2%)、そして大分離れて@madusathiefが220個 (2.5%)という結果になりました。
私は、サービス開始時からコンスタントに投稿していたので、投稿数が多いのは当然ですが、今年に入ってから投稿を始めた@hassotoiletがこれだけの数になっているのは驚異的です。
投稿数の変化
サービスを開始した2007年8月10日から1万ひらめきに到達するまで3年2ヶ月ちょっとかかりました。計算すると、平均で7.87個/dayのペースで投稿が行われたことになります。
と言っても、ずっと同じペースではなく、実際は下のような感じだったようです。
このグラフで、縦軸はある時点での総投稿数です。
サービス開始時は投稿も多く、勢いよく投稿数が増えていますが半年もするとなかなか伸びなくなり*12年程度が経過しました。
しかし、今年に入って、開始当初には及ばないものの勢いが回復しています。
これは、主に@hassotoiletの投稿のおかげだろうと思われます。
3年間のサービス運営で得た教訓
これから書く
おまけ
2010年11月23日現在の全投稿データをcsv形式で置いておきます。
# はてブ関連のサービスを開発していた経験から、開発者はクローリングなんて面倒なことから開放されるべきだ、と思うわけです
https://github.com/ryogrid/distribute/raw/master/all_hirameki_utf8.csv
こんなデータを何に使えばいいかって?
とりあえず、ひらめいったーのサイト( http://ryo.hayamin.com/idea/top ) で不可能だったひらめき検索が、エディタの検索機能と組み合わせることで実現できますよね(笑)
あとは、データマイニングなんかのスキルのある方は、これをデータセットとして利用してみてはいかがでしょうか。
例えば、ちょっと苦しいですが、アイデアの類型化や、アイデア創発支援システムの開発なんかに使うというのはどうでしょう。
関係ないけど
分散マシン操作ライブラリ Svengali
http://sourceforge.jp/projects/svengali/wiki/FrontPage
というものを作っています。
便利なので、よかったら使ってみて下さい。
*1:私の投稿が減ったのが原因かも・・・・?