日記汚すのが嫌なので、こっちに書きます。
週刊ホッテントリというアイディアは割と前から持ってて、ただ、ちょっとしたWebサービスでも私だと20時間くらいかかってしまうので手を付けてないって話でございまして。
6時間おきにホッテントリのRSSを巡回。URLを記録しておく。重複だけ削って、後はとりあえず記録。
そんで、金曜の夕方5時になったら、このURLのリストを元に、適宜ランク付けして、上位記事20件を選び、RSSファイルを書き出す。金曜の夕方なのは、ホッテントリなんて平日に読んでんなって意味で。
大事なのはこのランク付けで、これ次第で有意義なリストになるか否かが決まる。というわけで、各URLに下のような処理などを行ってランクを付ける。
当該記事のページがRSSへのリンクがある場合、そのRSSに含まれる全ての記事のブクマ数から当該記事のブクマ数偏差値を計算し、偏差値70未満の記事は候補から切捨てる。
はてなでの被ブクマ数と、その他のSBMでの被ブクマ数の比率を見る。はてなでばかりブクマされてる記事は切捨てる。
はてブ1件あたりブコメ長さ(bytes/boocomme)を計算する。ブコメの多い(長い)記事はランクを下げる。
記事の日付が解るならば、それを見る。古い記事ならランクを上げる。
とか、まぁそんな感じ。
あとで実装する 週刊ってちょっとスパンが長くないか? ライトユーザ向け? ブコメ量が多いとランクが下がるのはなぜか。俺はむしろ上がる気がする 「はてな関連でランクを下げ...
フットワークの軽い人はそれだけで賞賛に値します。 基本コンセプトは「自転車置場の議論の排除」。 自転車置場の議論は、その議論自体が無意味であるばかりでなく、論理学からは...