カテゴリー 「はてな統計」 RSS

2017-02-19

[]はてなブログドメインに限るとどうか

エントリー http://anond.hatelabo.jp/20170219014318

新着エントリーに入ったはてなブログ12エントリー

そのエントリーブックマーカー中で公開して重複ブックマークを行っていたID

重複出現回ID
51
31
25
173

(注: n重複のID数の中にn+1重複のID数は含まれていない)

非公開ブックマークが行われた回数は32回。

50%以上が非公開ブックマークだったのは2エントリー

コメ非表示設定サイトが1エントリー。 (※この行あとから追加)

[]はてブ新着エントリーは何個のIDによって形作られているか

いわゆるはてブ互助会というもの存在するのかどうかを考察するために集計してみた。

データ採取したのは 2017-02-18 23:28

598個のIDが1,010回の公開ブックマークを行っていた。

非公開ブックマーク247回。

合計1,257回のブックマークにより136個の新着エントリーが生み出されていた。

136の新着エントリーのうち、非公開ブックマーク50%以上だったものが8エントリー存在した。 (※この行あとから訂正)

全て公開ブックマークだったのは54エントリー

コメ非表示設定サイトが2エントリー。 (※この行あとから追加)

公開されているIDのうち20エントリー以上にブクマしてたのが2ID10エントリー以上にブクマしていたのが5ID

高重複ブックマーカーの多くはブコメでは無言だが、同名IDTwitterなどは人間らしさを感じさせるものだった。

上位重複者の中では4つほど人間がやってるのかにわか判断が付かないIDもあった。

重複出現回ID
251
241
161
141
111
94
82
73
65
510
415
335
283
1436

(注: n重複のID数の中にn+1重複のID数は含まれていない)

公開ブックマークにおいて[あとで読む]タグは71回使われていた。比率は7%。

2017-02-18

[]続・ブクマ1000超えしている11記事の内どれだけ重複するIDがあるか(JSON

エントリー: http://anond.hatelabo.jp/20170216041052

遊びでJSONブックマークデータを取れるようにしたので2日後のデータを。

7,604個の公開されたID11,986回のブックマークを行い、3,714回の非公開ブックマークと合わせて15,700回のブックマークにより11個の1000ブクマ超え記事を生み出していた。

前回より高頻度重複IDが減っているのは[あとで読む]タグブクマが消化されたのか、手作業で数えた私が間違えていたのか、スパマーにそういう習性があるのか、ちょっとからない。

エントリーでチェックした1000ブックマーク以上されている11記事中n記事ブックマークしているID

11, 5 ID

10, 4 ID

9, 10 ID

8, 15 ID

7, 31 ID

6, 52 ID

5, 99 ID

4, 226 ID

3, 555 ID

2, 1481 ID

重複なし, 5126 ID

(注: n重複のID数の中にn+1重複のID数は含まれていない。つまり10重複のID数の中に11重複のID数は含まれていない。)

ブクマ公開非公開url
25941860734(28%)ttp://www.nakahara-lab.net/blog/archive/7308
19721485487(25%)ttps://togetter.com/li/1079883
17331367366(21%)ttp://omocoro.jp/kiji/101534/
13851019366(26%)ttp://qiita.com/shu223/items/9e3a50e092c2997fe6d2
12751026249(20%)ttp://ironna.jp/article/5686
1231999232(19%)ttp://blog.tinect.jp/?p=36441
1163915248(21%)ttps://togetter.com/li/1078513
1135790345(30%)ttp://www.lifehacker.jp/2017/02/170205_free_alternatives.html
1130839291(26%)ttp://careersupli.jp/lifehack/eiga/
1053827226(21%)ttp://anond.hatelabo.jp/20170206102543
1029859170(17%)ttp://appmarketinglabo.net/staba-sns/

2017-02-16

[]http://anond.hatelabo.jp/20170216041052

重複が多いIDはてなブックマーク無言ブクマなので意図は推測するしか無いのだけど、普通に後々見返すためなんじゃないかと思える。

何年か後に2017年2月15日ホットエントリー一覧を見たいなと思ったとする。そういう時に役立つ機能はてなブックマーク自体提供していない。そんな時も自分ブックマークしてデータを持っていれは簡単に見返すことが可能である

要するにはてなブックマークが低機能すぎる。

ブクマスパム可能性はどうか。おそらく、重複が少ないIDの中に紛れ込んでいるんじゃないかと思うがこのデータから検証しづらい。

[]ブクマ1000超えしている11記事の内どれだけ重複するIDがあるか

http://anond.hatelabo.jp/20170215193247

の回答にあるブクマスパム説を検証するために数えてみた

7,086個のID12,216回のブックマークを行って111000超え記事を生み出していた。1ID平均1.72ブクマ

http://b.hatena.ne.jp/ranking/weekly1000ブックマーク以上されている11記事中n記事ブックマークしているID

11, 6ID

10, 6ID

9, 12ID

8, 23ID

7, 42ID

6, 71ID

5, 130ID

4, 263ID

3, 624ID

2, 1595ID

重複なし, 4314ID

(注: n重複のID数の中にn+1重複のID数は含まれていない。つまり10重複のID数の中に11重複のID数は含まれていない。)

集計対象11ページ

ttp://b.hatena.ne.jp/entry/www.nakahara-lab.net/blog/archive/7308 (※この行間違えてたので修正)

ttp://b.hatena.ne.jp/entry/s/togetter.com/li/1079883

ttp://b.hatena.ne.jp/entry/omocoro.jp/kiji/101534/

ttp://b.hatena.ne.jp/entry/qiita.com/shu223/items/9e3a50e092c2997fe6d2

ttp://b.hatena.ne.jp/entry/ironna.jp/article/5686

ttp://b.hatena.ne.jp/entry/blog.tinect.jp/?p=36441

ttp://b.hatena.ne.jp/entry/s/togetter.com/li/1078513

ttp://b.hatena.ne.jp/entry/careersupli.jp/lifehack/eiga/

ttp://b.hatena.ne.jp/entry/www.lifehacker.jp/2017/02/170205_free_alternatives.html

ttp://b.hatena.ne.jp/entry/anond.hatelabo.jp/20170206102543

ttp://b.hatena.ne.jp/entry/appmarketinglabo.net/staba-sns/

はてブのページはスクレイピング拒否するかのようにJavaScriptで描画しているわ、コピペすると1ブクマ3行になっているわ、3行固定かと思えば2行のところがあるわ、めちゃくちゃなのでもうやらない。

ログイン ユーザー登録
ようこそ ゲスト さん