カテゴリー 「はてな統計」 RSS

2018-02-13

[]増田日本論をぶつ確率

増田サブジェクトまたは本文にその単語が含まれ確率

増田日本論をぶつ確率

1日の増田日本人」入り日本」入り「国」入り
2018-01-019375(0.5%)34(3.6%)35(3.7%)
2018-01-02128043(3.4%)109(8.5%)89(7.0%)
2018-01-03137030(2.2%)92(6.7%)84(6.1%)
2018-01-04141346(3.3%)135(9.6%)124(8.8%)
2018-01-05179329(1.6%)115(6.4%)91(5.1%)
2018-01-06174039(2.2%)122(7.0%)90(5.2%)
2018-01-07145039(2.7%)105(7.2%)82(5.7%)
2018-01-08120521(1.7%)87(7.2%)51(4.2%)
2018-01-09149325(1.7%)92(6.2%)84(5.6%)
2018-01-10145322(1.5%)124(8.5%)140(9.6%)
2018-01-11163012(0.7%)107(6.6%)118(7.2%)
2018-01-12163913(0.8%)80(4.9%)77(4.7%)
2018-01-13126921(1.7%)64(5.0%)67(5.3%)
2018-01-14162637(2.3%)112(6.9%)81(5.0%)
2018-01-15173920(1.2%)71(4.1%)103(5.9%)
2018-01-16175518(1.0%)78(4.4%)88(5.0%)
2018-01-17194619(1.0%)79(4.1%)80(4.1%)
2018-01-18178913(0.7%)74(4.1%)88(4.9%)
2018-01-19148415(1.0%)52(3.5%)56(3.8%)
2018-01-20144817(1.2%)71(4.9%)75(5.2%)
2018-01-21166714(0.8%)66(4.0%)94(5.6%)
2018-01-22147214(1.0%)60(4.1%)57(3.9%)
2018-01-23177818(1.0%)70(3.9%)80(4.5%)
2018-01-24140614(1.0%)49(3.5%)66(4.7%)
2018-01-25181511(0.6%)59(3.3%)62(3.4%)
2018-01-2614638(0.5%)56(3.8%)52(3.6%)
2018-01-2714258(0.6%)57(4.0%)53(3.7%)
2018-01-28147726(1.8%)88(6.0%)64(4.3%)
2018-01-29145410(0.7%)57(3.9%)61(4.2%)
2018-01-3016287(0.4%)44(2.7%)37(2.3%)
2018-01-31180127(1.5%)91(5.1%)75(4.2%)
2018-02-01189514(0.7%)67(3.5%)66(3.5%)
2018-02-02199811(0.6%)40(2.0%)49(2.5%)
2018-02-03166710(0.6%)66(4.0%)59(3.5%)
2018-02-04186817(0.9%)77(4.1%)75(4.0%)
2018-02-05243314(0.6%)63(2.6%)57(2.3%)
2018-02-06192911(0.6%)61(3.2%)67(3.5%)
2018-02-07182513(0.7%)77(4.2%)70(3.8%)
2018-02-08178615(0.8%)69(3.9%)77(4.3%)
2018-02-0915617(0.4%)44(2.8%)40(2.6%)
2018-02-10168310(0.6%)61(3.6%)36(2.1%)
期間合計66490763(1.1%)3125(4.7%)3000(4.5%)

増田が男女論をぶつ確率

「女」入り「男」入り
2018-01-0178(8.3%)40(4.3%)
2018-01-0285(6.6%)45(3.5%)
2018-01-0399(7.2%)74(5.4%)
2018-01-04131(9.3%)85(6.0%)
2018-01-05183(10.2%)119(6.6%)
2018-01-06197(11.3%)116(6.7%)
2018-01-07113(7.8%)83(5.7%)
2018-01-0891(7.6%)38(3.2%)
2018-01-09111(7.4%)80(5.4%)
2018-01-10108(7.4%)63(4.3%)
2018-01-11170(10.4%)113(6.9%)
2018-01-12183(11.2%)122(7.4%)
2018-01-13126(9.9%)96(7.6%)
2018-01-14258(15.9%)196(12.1%)
2018-01-15136(7.8%)85(4.9%)
2018-01-16118(6.7%)64(3.6%)
2018-01-17177(9.1%)104(5.3%)
2018-01-18140(7.8%)72(4.0%)
2018-01-19113(7.6%)57(3.8%)
2018-01-20131(9.0%)81(5.6%)
2018-01-21155(9.3%)95(5.7%)
2018-01-22149(10.1%)110(7.5%)
2018-01-23158(8.9%)107(6.0%)
2018-01-24106(7.5%)67(4.8%)
2018-01-25245(13.5%)168(9.3%)
2018-01-26157(10.7%)76(5.2%)
2018-01-27177(12.4%)119(8.4%)
2018-01-28221(15.0%)138(9.3%)
2018-01-29217(14.9%)164(11.3%)
2018-01-30183(11.2%)128(7.9%)
2018-01-31161(8.9%)89(4.9%)
2018-02-01193(10.2%)130(6.9%)
2018-02-02204(10.2%)94(4.7%)
2018-02-03155(9.3%)75(4.5%)
2018-02-04188(10.1%)96(5.1%)
2018-02-05220(9.0%)118(4.8%)
2018-02-06154(8.0%)78(4.0%)
2018-02-07147(8.1%)89(4.9%)
2018-02-08143(8.0%)91(5.1%)
2018-02-09139(8.9%)85(5.4%)
2018-02-10147(8.7%)96(5.7%)
期間合計6367(9.6%)3946(5.9%)

2018-02-06

[][]2018年2月5日増田投稿数は2,433件

昨日2018年2月5日増田投稿数は2,433件。6日0時2分数え。

しかしたら最多記録かも。ここ半月ほど気にしてなかったから違うかもしれないけど。

追記

ここ2週間、1月22日以降、6日0時台の時点で残ってるエントリが2000本超えてるのは昨日だけのようだ。

追記

2018年2月27日0時40分台数えで

2018年2月17日 2693

2018年2月25日 2368

2018年2月26日 2465

ここらへんが最多記録になった可能性高し

追記

2018年2月27日 2691

追記

2018年3月14日 2998

2017-12-20

[][]2017年12月19日増田投稿

2017-12-20 0:00 のカウント2088

最多記録ではないかもしれないけど、結構多いんじゃないかな?

追記: 最多かも。11月13日11月22日あと10月18日も瞬間的な速度は出ていたみたいだけど1日通して2000は越えてなかったんじゃないかな。当時のデータを持ってないので断言はできないけど。

追記: 翌日2017-12-202017-12-21 0:01のカウント2071。ほぼ同じ。

追記: 2017-12-21は2017-12-22 1:15のカウント2098。3日連続2000超え。推定最多記録更新

追記: 2017-12-22は2017-12-23 0:00のカウントで1945。2000超え記録は3日で途絶えたが依然高い水準。

追記: 2017-12-232017-12-24 0:01のカウントで1390。週末落ちるのはいつも通り。

2017-11-24

[]増田で100ブクマ集められる確率

140本くらい増田を書けば1回くらいは100ブクマ集められるはず。

「『はてなアノニマスダイアリー』の人気エントリー」ページから順位ブクマ数を取得

ブクマ順位ブクマ上位%(参考値)備考
179540.00006%
252870.00013%
343300.00019%
440660.00026%
636350.00039%
829850.00052%
1228030.00078%
1824670.0012%
2620100.0017%
3818890.0025%
5516040.0036%
7914280.0051%
11412180.0074%
16410870.011%
2379440.015%
3418310.022%
4927290.032%
7086310.046%
10205390.066%
14694490.095%
21163790.14%
30473110.20%
43882510.28%
63191900.41%
91001320.59%
109201040.71%
13104760.85%
15725561.0%
22644341.5%
32608212.1%
46956123.0%
6761754.4%
8114035.2%
9736826.3%
14021019.1%
227079114.7%1usersの末尾
348888022.5%
15473980100%参考値・2017-11-24現存する増田エントリ

※ 消されたエントリも含めての順位なので総エントリ数を現存する増田エントリ数にするのは正しくないのだけど、他に数字がないのでそうする。なので上位%の値は参考値。

チャート https://imgur.com/XOMLYCj

その両対数https://imgur.com/mFdhLNH

ブクマ数100を越えたあたりからブクマ数を伸ばす難易度が一段上がるようだ

データの取り方

昨日増田新着エントリーeid順をプロットしてみたけれど、人気順(count順)のデータも同じ仕組みで取れるなと思って取得。ブクマをいくつ集めると上位何パーセント位置することになるのかを見てみた。

http://b.hatena.ne.jp/entrylist?sort=count&url=https%3A%2F%2Fanond.hatelabo.jp%2F&of=(順位数字-1) で順位数字指数関数的に増やしていき、そのブクマ数を取得した。

2017-11-23

[][]増田投稿はここ半年で2倍に増えたがファーストブクマは2年半横ばい

増田投稿数とファーストブクマ数、ホットエントリ入り件数の推移チャート https://imgur.com/aEcqWmu

概要

ゴールデンウィーク明けからはてなアノニマスダイアリーへの投稿が急増しはじめ年初の2倍、ここ数日に至っては3倍の投稿が行われるようになっている。

一方1日に行われる増田へのファーストブックマークの数は2015年中頃から100〜180件/日、平均128ファーストブクマ/日で横ばいで推移。全然はてぶしてもらえなくなった、ブクマが集まらなくなったという増田愚痴に繋がっている。

毎月のホットエントリ(総合)入り件数2017年に入ってから180件/月くらいで頭打ち。全ホットエントリ12%を占めていてこれ以上増えるとはてブ迷惑かもしれない。

歴史的増田投稿数とファーストブクマ数、ホットエントリ入り件数は大きく見ると連動しつつも細かく見ると連動せずに増減してきた。

色々読み取れるチャートだけど考察はお任せする。

1日に行われる増田へのファーストブックマークの回数調査

anond:20171102230010と同じ要領で、

http://b.hatena.ne.jp/entrylist?sort=eid&url=http%3A%2F%2Fanond.hatelabo.jp%2F&of=数字

を1000エントリずつ捲ってそのエントリファーストブクマされた日時を取得した。

チャート https://imgur.com/jsBYGWd https://imgur.com/rbnzUb1

関連エントリ

この2つのエントリ数字比較した

[はてな統計]月別、増田ホットエントリ入りした回数 anond:20170302203515

■今年のゴールデンウィーク明けから増田投稿が急増、さら9月下旬から再加速してた anond:20171102230010

2017-11-20

[]平日と休日投稿された増田、どっちがブクマつきやすいの?

anond:20171120210840 への回答

まとめ?

2017年9月10月ホットエントリ入りした増田投稿曜日別、集めた総公開ブクマ

15755
19201
11985
13760
16555
11656
14379

曜日からたくさんブクマが付くというわけではない感じがする。

2017年1月2月ホットエントリ入りした増田投稿された曜日

38
40
49
41
41
35
50

2017年9月10月ホットエントリ入りした増田投稿された曜日

56
58
44
39
51
45
53

ホットエントリ入りできるかどうかは何曜日投稿されたかに影響されなさそう。

2017年9月10月ホットエントリ入りした増田に付いた公開ブクマが行われた曜日

14183
17411
16502
12453
15841
15206
11695

ブクマが行われる数自体は週末減少する。ただしホットエントリ入りしにくくなるわけではないということらしい。

2017年9月10月曜日の日数

9日
9日
9日
8日
8日
9日
9日

バット理解しづらい数字の羅列だけどごめんね。

2017-11-17

[][]アノニマスダイアリーはどんな消され方をするのか(期間1週間、データ追記)

増田投稿者自身が消したり、運営に消されたりして日を追うごとに減っていくが、どれくらいの勢いで減っていくのだろうか。

アノニマスダイアリー1日の総投稿数を毎晩数えてみた。本当は年単位でどれくらい減っているか知りたいのだけれどとりあえず。

はてなアノニマスダイアリー1日の総投稿

から下方向に数字を追っていくと減り方が分かる。

カウント日\投稿11/0911/1011/1111/1211/1311/1411/1511/16
11/101374
11/1113381569
11/12133215461395
11/131329153713441361
11/1413221502132413301711
11/15132014941322132916791603
11/161317149213191326166715891696
11/1713161492131613241661156016791651
11/3012761452125812571599145215161556
12/2012711451125212561599144315131552
2018/03/0912141359119611851484139314461504
2024/06/15104710548418551252116711641226

20171110日〜11月16日の0時台にカウントした

1週間でだいたい5%減るようだ。日が経つにつれ減少幅は小さくなる。もう少し減るのかと思っていた。

2017-11-16

[]はてサネトウヨ言ってる人の増え方を10単位で見ると

anond:20171116014109 の補足

各月のはてなブックマークホットエントリコメント欄はてサネトウヨと書かれたコメント数の推移

カウントはてサ自称リベラルサヨクネトウヨ
2005-030000
2007-030011
2010-031401231
2012-0340520
2015-033012795
2017-0269682175

仲良く増えていて、今年はおかしレベル

[]はてサはてサ言ってる人は本当に増えているのか

あるいははてなブックマークホットエントリウヨサヨ蔑称を使ったコメント数の推移

各月のはてなブックマークホットエントリコメント欄はてサネトウヨと書かれたコメント数の推移

カウントはてサ自称リベラルサヨクネトウヨ
2017-01145779147
2017-0269682177
2017-0599891197
2017-0670786294
2017-0797674365
2017-0893844148
2017-0911110124317
2017-1018222106351

10月は確かに倍増したらしい。

はてサネトウヨの類を書き込んだID

使用人数
はてサ327
自称リベラル56
サヨク277
上記3ついずれか641
ネトウヨ832
カウント対象ID74,233


はてな左翼のための場所です」という絶許狙いをしたかのようなエントリが人気になっていたが、ネトウヨ云々言っている人も全体の約1%しかいないわけで、小学校なら3クラスに1人しかいないレベルの変なやつであるという自覚を持ってもらいたい。

2017-11-05

[][]増田投稿が増えすぎてファーストブクマカは辛そう

増田投稿数が増えてきていてファーストブックマーカーは全部に目を通すことにそろそろ限界を感じている人もいるんじゃないだろうか。

1日の平均文字数は春先の2月3月より4割増えた。以前が220ページの文庫本だとすると、今は310ページの文庫本を読むのに相当する文章である

一方で1本あたりの文字数は減った。トラックバック簡単にできるようになり、はてブでも余裕で収まる長さの日記が増えたようだ。そういう日記は読み応えが無いんじゃなかろうか。

2017年10月2017年2〜3月増減
1日の平均エントリ1,289721+79%
1日の平均文字数168,864121,338+39%
1エントリ文字数中央値5264-19%
1エントリ文字数平均値131157-17%
1エントリ文字数最頻値1613+23%
タイトルトラバURLである59%47%+24%

文字数には改行文字も含む

※2〜3月の集計期間は2017年2月1日から2017年3月24

平均値は超長文エントリあるかないかで値が結構変わってくる。文字数10文字台のエントリの頻度はドングリの背比べ。

10月増田にありがちだった典型的16文字(改行抜いたら15文字)エントリはこんな感じ。

「男なら週刊少年チャンピオンだろ」

「お前にゃ向いてないからやめとけ」

「お前は自分心配でもしてろよ。」

「猫と同衾するし思い切り撫で回す」

2017-10-04

[]不評リニューアルでもはてブユーザーは離れなかった

しろ若干増えた可能性もある。

8月21日頃にはてなブックマークユーザーインターフェースが大幅リニューアルされ、かなり不評でユーザー離れが懸念されていた。 http://bookmark.hatenastaff.com/entry/2017/08/21/210000

その後ユーザーが増えたか減ったかはてなしかからないだろうが、一般ユーザーからも観察可能ホットエントリに付くブックマーク数で推測してみたい。

カテゴリホットエントリに付いた公開ブックマーク

2017年8月(31日除く)605011
2017年9月622388

2.9%増加した。

日数を合わせるために8月31日カウントしなかった。

カテゴリホットエントリに付いた公開ブックマークユニークID

カテゴリcategory2017年8月(31日除く)2017年9月増減
世の中social146241430598%
政治経済economics141901289691%
暮らしlife1897219460103%
学びknowledge1275314225112%
テクノロジーit1985821200107%
おもしろfun7536738098%
エンタメentertainment1202012068100%
アニメゲームgame124961233299%
合計3283034160104%

4.1%増加した。

学びカテゴリテクノロジーカテゴリユーザー数の大幅な増加があり、政治経済カテゴリで大幅な減少が見られた。

若干の増加トレンドが今後も継続するのか、ただのゆらぎなのかは今後も見守っていかないと判断できない。ただリニューアルユーザー数の減少には繋がらなかったようだ。

はてブ一般的休日に数が落ち込む。日毎に細かく見ると8月お盆があった分ブクマ数が伸び悩み、9月敬老の日秋分の日の週末、理由は分からないがいつもよりブクマが多かった。これが若干の増加として現れた可能性が高いように思う。

2017-10-03

[]はてな決算資料記載されたはてなユーザー

会計年度ユーザー月間ユニークブラウザ
2014400万人0.63億UB
2015450万人0.94億UB
2016520万人1.71億UB
2017618万人2.24億UB

株式会社はてな 2017年7月期 通期決算説明会資料 http://v4.eir-parts.net/v4Contents/View.aspx?template=ir_material_for_fiscal_ym&sid=40889&code=3930 より

anond:20170219233955データでは2015年から2017年にかけて公開ブックマーク数は1.30倍になっていた。

上記データの月間ユニークブラウザ数2.38倍とブクマ数以上の伸びを見せた。

ユーザー数は1.37倍とはてブ数に近い伸び率。

ちなみに2017年に入ってからは公開ブックマーク数は頭打ちになっている。

※倍率が間違っていたので訂正

2017-09-10

[]はてなIDから村人の年齢くらいなら推測できる?

関連 anond:20170909151145

使い捨てIDがあるならそれをIDから割り出せないか

人間の目で見ていたらスパム臭い使い捨てID名は見当がつくのだが、それを機械により分けさせるルールを作れと言われたらこれがなかなか難しい。ちょっとトライしてみてこりゃ無理だという気になってきた。存在する単語無関係ランダム性の高い文字列みたいなのを判別できれば良いのかもしれないが。

副産物としてはてなIDありがちな先頭4文字、末尾4文字リストしてみる。はてなで「タカシ オメデト タカシ」と書いとけば多くの人が自分のことかと反応してくれるかもしれない。

はてなIDでよくある先頭4文字

順位先頭4文字件数
1taka320
2hiro293
3masa284
4yama221
5shin187
6take182
7yuki168
8yosh163
9tomo156
10kazu153
11naka142
12sato120
13neko111
14hate110
15taku107
16kuro106
17haru100
18mori98
19fuji97
19momo97
19shir97
22tama91
23maru90
24saka85
25shim84
26hana83
26hide83
26kana83
26kawa83
30miya82

はてなIDでよくある末尾4文字

順位末尾4文字件数
1chan194
2ashi162
3hang134
4suke123
5ichi119
6oshi101
7life95
8hiro87
9yama84
10blog82
11taro81
12neko71
13mura70
14moto68
15maru67
16ikun66
17201765
18akun63
19arou63
19atsu63
21uchi61
22nkun59
22suki59
24kawa58
24tion58
26ster56
27200055
27papa55
27yuki55
30isan54
30saki54

はてなID末尾に付く西暦のような数字

末尾4桁件数末尾4桁件数末尾4桁件数
1900219501200055
1901119512200125
19021952200218
19031953420038
190419541200411
190519552200515
190619561200611
190719571200717
190819583200813
190919592200917
191019602201023
1911319611201128
191219622201222
1913219634201317
1914219643201416
191519651201521
191619666201627
1917219673201765
191819684201814
1919719691020192
19201970820205
192111971620211
19221972820222
192321973102023
1924119741120241
1925119751520252
192619761620261
192719772620271
19281978112028
19291979102029
193019802320302
193111981152031
19321982142032
193319831320331
19341984232034
1935119851920353
193619862720362
19371987102037
19381988232038
193931989272039
194011990212040
194119911420411
19421199292042
1943199362043
19441199492044
194541995720451
1946199662046
19471997220471
19481199892048
1949119991420491

20世紀のもの誕生年、21世紀のものアカウント作成年だろうか。

そうだとするとはてなは25歳から45歳くらいの人が多そうである

アカウント作成年については去年、今年を除けば2011年からの人が多そうである

2017-09-09

[]はてブでは毎月5000のID使い捨てられているのではないか検証

エントリ anond:20170909151145

捨てIDか? ロングテールか?

ホットエントリ観測していると月ごとに3万弱のIDを見ることができるが、それを6ヶ月合算しただけで64,356になることに違和感を感じた。

増加分がホットエントリをめったにブクマしないユーザーによるものだとしたら、その月以前の合算ユーザー数は月を追うごとに増加幅は減少するはずである。もし増加幅が一定あるいはランダムなようならこの半年で3万のID使い捨てられてきた可能性が高い。

その月までの累計IDはてブ総合ホットエントリに付いたもの

年月累積公開ユニークユーザー前計測との差
2017-0130431---
2017-0238178+7747
2017-0545566+7388
2017-0650830+5264
2017-0754994+4164
2017-0859708+4714
2017-0965173+5465

かに月を追うごとに増加幅が減少する様子が見られる。しかしこの数字グラフプロットしてみると結構直線的である

半年合算64,356IDという数字には捨てIDロングテールも両方寄与していると考えられる。

毎月3000から4000個の捨てIDが使われている可能性は捨てきれない。

もちろんただユーザーが入れ替わっているだけの可能性もあるが毎月1割入れ替わっているとも思えない。

※ 2017-09分のデータ追加

[]2017年前半のはてブユーザー数の推移を推定する

総合ホットエントリに付いた公開ブックマークユニークID

当該の総合ホットエントリに当該中に付けられた公開ブックマークから重複を除いたID数。

年月公開ユニークユーザー
2017-0130431
2017-0228746
2017-03欠測
2017-04欠測
2017-0528480
2017-0628781
2017-0728231
2017-0828773
2017-0929826

1月は若干多かったが、あとはほぼ横ばい。

公開ブックマーク率はおおよそ8割(79.8〜80.6%)

※2017-09分追記 はてブUI大幅変更で減ったりしていないかと思ったが微増。公開ブクマ数は横ばい。小の月なので1日少ない。

カテゴリホットエントリに付いた公開ブックマークユニークID

特定カテゴリユーザー数が増えていないか確認。当該月のカテゴリホットエントリに当該中に付けられた公開ブックマークから重複を除いたID数。

カテゴリcategory2017年2月2017年8月増減
世の中social1443614741102%
政治経済economics1185514291121%
暮らしlife1894319237102%
学びknowledge1194812938108%
テクノロジーit209382007396%
おもしろfun64007605119%
エンタメentertainment1180612195103%
アニメゲームgame1118012655113%
合計 3308033097100%

政治経済カテゴリおもしろカテゴリブクマしたユーザーが約2割、大幅に増加。テクノロジー関連のユーザーが若干減少。全体としてはやはり増えていないことが確認できる。

2017年上半期に観測された全はてなID

上記のデータを得るのに使った全てのコメント観測されたID

64,356 ID

サンプルエントリ数: 29,091

サンプルコメント数: 3,740,664

はてなメディアガイド2017年7-9月版によると2017年6月の会員数は約600万人である

このID数の数字に若干違和感を感じる。

かにホットエントリを全くブクマせずに終わる月もあるのでホットエントリだけ観測していたのでは取りこぼしも多い。それでも2ヶ月、3ヶ月と網を張っていると徐々に観測される確率は高くなるはずであるしかし毎月観測されるID数は3万弱なのに、たった6ヶ月合算しただけで2倍以上になるだろうか? 大量のID使い捨てられている可能性が高い気がする。

もし6ヶ月合算で増えた分がホットエントリをめったにブクマしないユーザーだとしたら、その月以前の合算ユーザー数は月を追うごとに増加幅は減少するはずである。もし増加幅が一定あるいはランダムなようならこの半年で3万のID使い捨てられてきた可能性が高い。

これについては次のエントリ検証したい。

2017-05-03

[]http://anond.hatelabo.jp/20170428223646

http://anond.hatelabo.jp/20170402213435元ネタの基礎的な数字を将来ググってたどり着く人のために

2017年2月カテゴリホットエントリ

カテゴリユニークページ数延べページ数公開ブクマユーザーブックマーク公開ブックマーク公開ブックマークコメント人数コメントコメント平均ブクマ数/人
世の中1,1811,37215,367(38%)140,849115,45082%7,48653,54738%7.5
政治経済1,0531,29812,871(32%)89,43072,33481%5,61328,89332%5.6
暮らし1,1551,37223,120(57%)152,296121,04279%9,36851,52034%5.2
学び69891015,998(40%)69,58353,23477%5,17314,35621%3.3
テクノロジー1,1071,37223,152(58%)190,227148,80878%8,19132,19517%6.4
おもしろ4335317,376(18%)27,01121,93581%3,5409,99737%3.0
エンタメ70987412,464(31%)63,78650,96180%5,69020,69332%4.1
アニメゲーム9001,13712,705(32%)79,82265,23782%5,88225,75532%5.1
合計7,2368,86640,240(100%)813,004649,00180%16,156236,95629%16.1


おまけ

上記ホットエントリ中のはてなプログドメインだけを集計すると(hatenablog.com, hatenablog.jp, hatenadiary.com, hatenadiary.jp, hateblo.jp)

カテゴリユニークページ数延べページ数公開ブクマユーザーブックマーク公開ブックマーク公開ブックマークコメント人数コメントコメント平均ブクマ数/人
はてなブログドメイン63678619,128(48%)82,58565,26179%6,99221,63726%3.4

2017-04-28

[]ヤフコメはてブの頻出単語を見比べてみる

関連 http://anond.hatelabo.jp/20170428223646

日本という単語が出たからと言って必ずしも日本の話をしているわけではなく、日本経済新聞の一部だったり日本電気の一部だったりするのでこのデータからはあまり言えることが無いなと思ってお蔵入りさせてたもの

ヤフコメから似たようなデータが出てきたので比較できそうだから上げてみる。でもやっぱり言えることはあまりない気がする。

コメント欄にはびこる嫌韓嫌中 ヤフーニュース分析

https://headlines.yahoo.co.jp/hl?a=20170428-00000016-asahi-soci.view-000

2017年1月2月総合ホットエントリコメント欄で使われた固有名詞

固有名詞回数
日本10069
増田3041
アメリカ2402
韓国2087
東京1753
中国1590
https1408
安倍1331
1039
米国803
Twitter702
Google660
西野613
597
東芝544
大阪543
Amazon514
440
JASRAC428
任天堂419
自民党404
NHK403
平成396
沖縄384
アパ344
電通341
埼玉328
森友323
ドイツ318
goo317
朝日新聞311
欧米307
昭和299
news297
コス292
北朝鮮292
東大290
285
アジア277
ロシア277
横浜277
PTA276
status268
長谷川263
Web259
関西259
インド255
上野254
産経249
AI248

2017年1月2月総合ホットエントリコメント欄で使われた単語朝日新聞ヤフコメ分析の表にあるもの

歴史1100
被害1006
戦争826
国家790
慰安489
謝罪374
反日177
在日157

[]コメント欄にはびこる…… はてブでは上位がどんだけブクマしてる?

今回の分析では1週間で100回以上コメント投稿した人が全体の1%いた。この1%の人たちの投稿で全体のコメントの20%が形成されていた。

コメント欄にはびこる嫌韓嫌中 ヤフーニュース分析朝日新聞デジタル

http://b.hatena.ne.jp/entry/www.asahi.com/articles/ASK4W63LTK4WUTIL060.html

とその記事についたブクマコメント

はてブでは上位がどんだけブクマしてるんだろう

http://b.hatena.ne.jp/entry/334091096/comment/type-100

1%人達で全体コメント20%というウェイトは、はてブ数やTwitter投稿数でも変わりがないと思うな。

http://b.hatena.ne.jp/entry/334091096/comment/poko_pen

これを確認してみた。

はてなブックマーク全体を見渡せるデータは持ってないし、外部者がそんなにデータを取ったとしたらサーバ迷惑をかけてしまうだろうから2017年2月カテゴリホットエントリに付いたブクマについて確かめてみた。サンプルの取り方としては偏りがあるということを頭の片隅において見てもらいたい。

コメントが偏っているかどうかまでは追いかけていない。ヤフコメよりは駄洒落などのネタに走っている人が多いのではないだろうか。

ついでにパレートの法則は成り立っているか確認した。

カテゴリコメ数上位1%ユーザーコメントブクマ占有ブクマ数上位1%ユーザーブクマブクマ占有ブクマ数上位20%ユーザーブクマブクマ占有
世の中11,67510%22,19319%86,70875%
政治経済9,33013%14,51920%52,85673%
暮らし12,02010%19,94416%84,41970%
学び3,0266%8,43416%33,93564%
テクノロジー7,5165%27,58519%105,67871%
おもしろ1,7068%2,58912%13,54462%
エンタメ3,5387%7,50515%33,21765%
アニメゲーム5,2488%10,73216%45,42170%

※ここでコメ数上位1%ユーザーコメントなしブクマも含めた中の1%であるコメントしたユーザー1%に対する割合だと更に半分くらいの数字になる。

ヤフコメに比べるとコメントの上位1%への集中は若干緩やかである

政治経済、世の中、暮らしといったカテゴリで高めの集中が見受けられる。

ブックマーク数で見るとカテゴリによってはヤフコメ並みの20%の集中が見られる。コメントの上位集中が見られなかったテクノロジーカテゴリも集中の度合いが高いカテゴリになる。

上位20%が80%を占めるというパレートの法則については、それにかなり近い状況が確認できる。

おまけ 累積グラフ

上位ユーザー数vs累積コメントhttp://i.imgur.com/r0YaUzP.png

上位ユーザー数vs累積ブックマークhttp://i.imgur.com/Z62BmvV.png

コメント数など

カテゴリ公開ユーザーコメントユーザーコメントユーザー公開ブックマークブクマコメントコメント
世の中15,3677,48649%115,45053,54746%
政治経済12,8715,61344%72,33428,89340%
暮らし23,1209,36841%121,04251,52043%
学び15,9985,17332%53,23414,35627%
テクノロジー23,1528,19135%148,80832,19522%
おもしろ7,3763,54048%21,9359,99746%
エンタメ12,4645,69046%50,96120,69341%
アニメゲーム12,7055,88246%65,23725,75539%

2017-04-24

[][]増田ホットエントリ投稿時間帯とファーストブクマされた時間

2017年3月はてなアノニマスダイアリー

時間増田投稿総合ホットエントリ総合ホットエントリファーストブクマカテゴリホットエントリカテゴリホットエントリファーストブクマ
07188233164
1523562026
2393321210
3257137
41871235
51472185
62303145
73284384
84732287
9642211612
1087932114
11840982222
12909793032
139511473019
1489410113025
15995752326
168581082921
17909682624
189661573824
1985610113228
20879693035
219278124348
2278412113831
2390515144556

数字そのままだとピンとこないだろうから表計算に放り込んでグラフを描いてみると分かりやすい。

http://anond.hatelabo.jp/20170424175634否定的トラックバックを送ってしまったけど、午後7時の方はそんなに悪くない見立てでした。午後6時のほうがベターのようだけど。

[][]http://anond.hatelabo.jp/20170424175634

そんな気がするけどそうでもないようだよ。

休み増田を直接物色するよりも既に新着エントリホットエントリに上がった増田ブクマを付けるための時間らしい。

午後7時は2ちゃんねるなら賑わい始める時間だが(http://snowslide.s201.xrea.com/observation/post.html)、はてなブックマーカーは午後7時も午後2時も似たようなペースでブクマし続ける。

サンプル数は少ないけど1000ブクマを集めるような大人エントリとなるとこの傾向は通用しなくなるようだ。

2017年1月2月増田ホットエントリ投稿された時間

投稿時間ホットエントリ件数
018
112
24
33
44
54
62
73
85
99
109
1112
1215
1314
1410
1511
1617
1710
1814
1919
2020
2122
2225
2332

2017-04-02

[]ウヨサヨの争いに興味がないはてな村人はいないのか?

はてなサヨクアジトであり、政治豚の巣窟である政治的にギスギスした印象のはてなブックマークだが、ウヨサヨに興味がない人はみんないなくなってしまったのだろうか。自分の知っている普通世間話はてな村の興味の対象があまりにずれている気がしてならない。

しかしよく見ると、テクノロジーカテゴリホットエントリ政治経済カテゴリより勢い良くブクマが付いて行く気がする。しかブックマーク非公開の人が多そうだ。そういう気配から、もしかしたらテクノロジーカテゴリーには政治経済カテゴリに一切かかわらず、穏やかにはてなブックマークを楽しんでいる村人が存在するのではないかという可能性を感じた。

検証のためにテクノロジーカテゴリ政治経済カテゴリカテゴリデイリーホットエントリ情報を使うことにした。

http://b.hatena.ne.jp/hotentry/it/20170201

http://b.hatena.ne.jp/hotentry/economics/20170201

テクノロジーカテゴリ政治経済カテゴリでどれくらいのブックマーカー(公開のみ)が重複しているか

これの2月分の全データから、どちらか片方のカテゴリしかブクマしていない人、両方を掛け持ちしている人を数えてみた。

テクノロジーのみ13483 ID51%
テクノロジーのほうが2倍以上4612 ID18%
比率2倍未満3380 ID13%
政治経済のほうが2倍以上1677 ID6%
政治経済のみ3200 ID12%

その結果、政治経済カテゴリに一切関わらないようにしているブックマーカーが半数もいることが分かった。テクノロジーブクマがメインの人を合わせたら実に7割であるテクノロジーのみしかブクマしない人はそもそもブクマ数が少ないんじゃないのという疑念を持って調べてみたが、そういうことはなく、かなりアクティブブックマーカーが多かった。

暮らしカテゴリ政治経済カテゴリでどれくらいのブックマーカー(公開のみ)が重複しているか

テクノロジー分野が特殊なだけで、他のカテゴリ、例えば暮らしカテゴリだとみんな政治漬けなんじゃないだろうか。

暮らしのみ13160 ID51%
暮らしのほうが2倍以上4703 ID18%
比率2倍未満3756 ID14%
政治経済のほうが2倍以上1496 ID6%
政治経済のみ2914 ID11%

そんなことはなかった。テクノロジーカテゴリと同じように暮らしカテゴリ政治経済から分断されていた。

確かにネット外でもみんな街宣車には近づかないし、共産党事務所を覗き込む人もいない。はてなの村人も普通にそういう行動をとっていた。

この結果は自分にとっては意外だったのだが、皆の実感とは合っていただろうか。自分と同じようにはてブ認識がずれていた人がいたらこんなギスギスしたウヨサヨネタはほんの一部の人の間の興味対象であって、大多数はそうじゃないか安心してねと伝えてあげたい。

2017-03-26

[]はてなアノニマスダイアリー穏やかならぬ単語がよく使われる時間

日の出前の単語

互助会マウンティングメンヘラ底辺自己責任、アフィ、殺す、(笑)[全角]、ヘイト

早朝の単語

ネトウヨ、汚い、ガキ、ジャッブ、おっさんフェミ発達障害うんこ

昼の単語

ダサいサヨク、アホ、カス老害ボケハゲ

夕方単語

工作員テロリスト、おばさん、極右安倍、殺せ

夜のはじめの単語

はてサニートキモい、クソ雑魚バカ

夜半の単語

承認欲求馬鹿、ブス

丑三つ時の単語

(笑)[半角]、嫌いだ、ババア死にたい死ねクズ

不穏な単語が使われる時間 - 平均より上か下か

ヒートマップ http://imgur.com/rAvWPwb

2017年2月1日から3月24日までの現存エントリ

(1日の内その時間単語出現割合)÷(1日の内その時間エントリ割合) - 1

0が平均的、マイナスは少なく、プラスは多い

単語\時間01234567891011121314151617181920212223
馬鹿0.50.30.40.30.4-0.20.4-0.2-0.1-0.40.0-0.1-0.2-0.30.1-0.1-0.30.00.0-0.2-0.10.00.40.2
ブス0.30.60.10.1-0.10.1-0.2-0.5-0.50.1-0.3-0.10.4-0.1-0.30.30.30.0-0.40.00.0-0.2-0.60.5
(笑)0.50.10.80.00.6-0.10.00.1-0.5-0.10.0-0.3-0.20.00.1-0.3-0.20.2-0.20.10.00.00.20.2
嫌いだ0.60.71.31.8-1.0-0.3-0.5-0.6-0.5-0.8-0.20.30.20.1-0.5-0.3-0.10.1-0.20.4-0.2-0.40.20.2
ババア-0.60.61.92.50.5-1.0-1.0-0.1-1.00.30.3-0.7-0.4-0.4-0.4-0.11.40.2-0.7-0.60.30.2-0.30.5
死にたい-0.10.20.71.21.0-0.20.2-0.60.1-0.8-0.1-0.90.70.1-0.2-0.1-0.21.00.1-0.3-0.7-0.1-0.20.4
死ね0.3-0.30.31.60.40.1-0.20.1-0.2-0.3-0.2-0.3-0.2-0.30.30.0-0.1-0.2-0.2-0.20.00.60.20.3
クズ0.20.40.71.40.30.60.40.4-0.6-0.20.2-0.3-0.3-0.7-0.4-0.3-0.50.3-0.40.20.10.60.30.1
互助会-0.50.3-1.0-1.01.60.0-1.0-0.50.4-0.50.0-0.60.40.2-0.3-0.10.2-0.3-0.10.5-0.20.50.90.1
マウンティング0.7-0.30.4-1.01.70.1-0.20.1-0.6-0.50.50.6-0.1-0.3-0.80.60.10.7-0.80.1-0.40.2-0.1-0.2
メンヘラ0.6-0.10.8-1.02.6-1.02.1-0.3-0.5-1.00.1-0.20.0-0.5-0.82.1-0.4-1.0-0.3-0.1-0.2-0.20.50.8
底辺-0.60.6-0.51.72.41.90.7-0.4-0.8-0.60.0-0.3-0.2-0.4-0.8-0.7-0.2-0.4-0.70.6-0.30.32.01.4
自己責任0.40.9-0.5-0.2-1.04.0-1.00.3-0.2-0.40.5-0.1-0.60.50.30.30.0-0.8-0.6-0.50.00.1-0.70.8
アフィ-0.4-0.60.1-0.10.15.4-1.0-0.3-0.1-1.00.2-0.50.1-0.1-0.5-0.1-0.20.1-0.10.60.7-0.1-0.21.1
殺す-0.50.90.70.8-0.41.7-0.5-1.0-0.8-0.70.7-0.1-0.4-0.70.5-0.1-0.6-0.2-0.2-0.20.40.81.0-0.3
(笑)0.4-0.2-0.40.41.32.40.01.4-0.3-0.5-0.2-0.7-0.40.1-0.4-0.2-0.2-0.1-0.2-0.20.21.00.30.3
ヘイト0.2-0.3-0.1-0.30.81.10.60.6-0.60.60.20.0-0.8-0.5-0.2-0.3-0.20.00.90.50.20.5-0.6-0.4
ネトウヨ-0.30.3-0.4-0.72.20.92.60.90.00.1-0.1-0.30.10.0-0.3-0.2-0.40.10.0-0.10.20.3-0.6-0.2
汚い0.2-0.20.50.2-1.0-1.00.9-0.1-0.4-0.30.0-0.4-0.1-0.1-0.4-0.10.20.20.4-0.50.20.10.30.6
ガキ0.10.80.00.61.01.31.6-1.0-0.60.5-0.8-0.60.2-1.00.2-0.4-0.10.2-0.40.4-0.30.90.50.0
ジャッブ-0.8-0.4-0.6-0.30.80.01.30.10.00.61.00.00.80.6-0.8-0.3-0.80.1-0.1-0.1-0.2-0.41.0-0.4
おっさん0.1-0.30.6-0.5-0.1-0.20.70.7-0.10.1-0.1-0.2-0.3-0.1-0.30.40.1-0.20.00.1-0.10.20.20.0
フェミ-0.50.70.40.4-1.00.1-0.21.2-0.30.60.2-0.2-0.40.1-0.10.4-0.20.3-0.1-1.0-0.61.1-0.5-0.2
発達障害0.00.10.5-0.40.2-0.5-0.7-0.81.0-0.7-0.5-0.20.00.30.10.50.2-0.10.0-0.30.00.10.10.0
うんこ0.40.60.20.00.3-0.30.10.10.7-0.30.40.4-0.40.5-0.7-0.4-0.1-0.3-0.7-0.10.40.2-0.40.3
ダサい0.1-1.00.00.6-1.0-1.0-1.0-1.0-1.01.5-0.5-1.0-0.6-0.20.30.20.01.2-1.00.0-0.11.21.00.3
サヨク0.2-0.20.1-1.0-1.0-1.0-1.0-1.0-0.22.10.5-1.0-0.60.7-1.01.10.0-0.1-1.0-1.00.91.30.6-0.6
アホ0.10.00.30.00.3-0.1-0.1-0.4-0.30.6-0.10.00.1-0.1-0.10.1-0.6-0.20.00.10.1-0.10.00.4
カス0.30.00.1-1.0-1.00.0-1.00.1-0.5-0.10.10.60.1-0.10.30.4-0.5-0.30.3-0.40.00.00.4-0.3
老害-0.2-1.0-0.3-1.0-1.0-1.00.20.70.6-0.60.00.5-0.4-0.41.60.40.00.2-0.7-0.31.2-0.4-1.00.8
ボケ0.0-0.7-1.0-0.30.8-1.0-1.00.6-0.60.1-0.60.0-0.40.11.00.11.10.5-0.8-0.4-0.20.51.0-0.4
ハゲ0.80.20.6-1.0-1.00.90.4-1.00.31.4-0.60.10.0-0.70.0-0.42.4-0.30.7-0.6-0.6-0.3-1.0-0.3
工作員0.1-1.0-1.0-1.0-1.0-1.0-1.01.40.5-1.0-1.0-1.0-0.6-0.6-0.62.1-0.55.70.20.0-0.1-0.6-1.0-0.6
テロリスト-0.5-1.0-1.0-1.0-1.0-1.0-1.00.0-1.0-1.0-0.60.1-1.00.0-0.32.00.54.60.7-0.60.1-1.0-0.6-0.6
おばさん0.00.0-0.1-1.00.8-1.0-1.0-1.00.40.60.10.0-0.8-0.30.00.3-0.11.7-0.2-0.10.7-0.2-0.3-0.4
極右-1.0-0.8-0.7-1.0-1.0-1.0-1.0-0.6-0.3-1.0-0.2-0.3-0.8-0.8-0.1-0.6-0.62.73.01.90.60.5-1.0-0.9
安倍-0.5-0.6-0.8-0.8-0.5-0.6-0.1-0.7-0.4-0.6-0.5-0.7-0.8-0.40.20.70.71.02.21.30.30.0-0.8-0.8
殺せ-0.60.7-1.0-1.00.6-1.00.40.0-1.00.40.10.1-1.0-0.40.30.00.10.71.60.9-0.6-0.3-0.2-0.3
はてサ0.1-1.0-1.00.6-1.0-1.0-1.0-1.0-0.20.8-0.50.8-1.0-0.21.1-0.2-0.50.30.30.01.30.7-0.5-0.1
ニート0.1-0.30.4-0.5-0.3-0.20.2-0.6-0.50.0-0.80.5-0.30.1-0.2-0.50.10.6-0.3-0.51.00.30.8-0.1
キモい0.40.0-1.00.1-1.0-1.00.2-0.6-0.4-0.8-0.20.40.20.0-0.30.1-0.20.40.3-0.30.30.8-0.1-0.1
クソ雑魚0.61.6-1.0-1.00.21.9-1.00.5-0.5-1.0-0.70.60.0-0.8-0.20.00.4-0.7-0.2-0.1-0.2-0.22.30.3
バカ0.30.20.10.3-0.10.00.2-0.5-0.4-0.10.10.1-0.1-0.1-0.1-0.1-0.1-0.10.00.00.00.00.50.1
承認欲求0.50.6-1.00.8-1.00.31.00.4-0.10.3-0.7-0.3-0.50.1-0.3-0.60.6-0.5-0.10.60.0-0.3-0.41.4
いずれかの語0.10.00.10.00.10.00.0-0.2-0.2-0.1-0.1-0.1-0.2-0.10.00.00.00.10.10.10.00.10.10.1

死ね」と「死にたい」は同じ時間帯に比率が増える。

バカ、アホ、ボケカスなどよく使われる罵倒語ピークがはっきりしない。

アフィ、ヘイトネトウヨジャップのような嫌儲用語は使う人が限られるのか明確なピークが見られる。

テロリスト工作員極右安倍も同じ人が使うワンセットの言葉可能性が高い。

早朝に高い数値が出ると言ってその時間絶対数が多いわけではなく、その単語を使わない人の書き込み活動が落ちているだけと見てほしい。絶対数は下記の表で。

不穏な単語が使われる時間 - 絶対数

その単語を含むエントリ

単語\時間01234567891011121314151617181920212223合計
投稿9397015093212542152954216498601117116412361255122512821103120812331053113511971030120321605
(笑)63364115199132215344940455860444064465150555964992
バカ382718137711713254042343534353336393437374843693
安倍158324384121017119224767587712376463779675
馬鹿41272112105121017163131282539322234372530364243626
死ね24101317755910121917211732262019201722382631437
おっさん1891434391310161816151915322218212018262221382
アホ15111055344721151820171722615181718161626326
ネトウヨ81141105131081212101616111381715121719512265
クズ1312109445738161010591171991515231616256
発達障害1088231111336913161419141113711131212220
カス11652437111712101416581461011138193
ブス111053222238791510815131179108416190
底辺3927754213978623763146132523175
殺す3964141121375313837761115146149
(笑)94234527336259576776916911147
嫌いだ1088611121610109467971065810145
極右1113652273329322012121140
うんこ87422123741010512256526109410136
死にたい555431214161128675148426510125
ニート6341112125110586471153139116125
キモい7422121598758599481256119
汚い63423223646646789377710115
互助会24311425287456457489697
ジャッブ1211213236105109141654439396
ボケ4112314253611610813489395
ヘイト522122231665134445107682394
マウンティング7233112127854195915364493
フェミ2532114266436584752112493
おばさん43224655145741444843392
ガキ452222315126634636396586
自己責任551142226427664122451880
アフィ212115125254243546743978
承認欲求5421222413253262464321075
メンヘラ52333114342113233335771
クソ雑魚56122116413451333311570
老害211231352295341272661
ババア13431134122237411442558
殺せ131113332433585122253
ハゲ4221125133132925112252
テロリスト11133294165131151
工作員22211181163221143
はてサ2113142521332541242
ダサい211411233252254341
サヨク21115314522453140
いずれかの語29421316796816389941432152873142973143513843273733923283263923433856268

2017-03-25

[]増田内の森友学園口利き疑惑関連のエントリ数推移

関連する語を含むエントリの数。残っているエントリのみ対象

月日\語安倍森友籠池塚本国有地稲田昭恵教育勅語ノイホイOR菅野蓮舫スーダン赤旗口利き辻元いずれかを含む
02/0111
02/0222
02/0322
02/0411
02/05314
02/0622
02/072114
02/08213
02/0911
02/1033
02/1111
02/125117
02/13112
02/14112
02/16431218
02/17721111119
02/1851217
02/1933
02/2082110
02/21224
02/221211233222
02/23161454973128
02/241610161131123
02/2511976842124
02/2663322127511269
02/27141116133122
02/281414126520
月日\語安倍森友籠池塚本国有地稲田昭恵教育勅語ノイホイOR菅野蓮舫スーダン赤旗口利き辻元いずれかを含む
03/01148313111121
03/024639820711151
03/039106121115
03/0428236103331235
03/0515101522117
03/0661011316
03/072111262124
03/082121134130
03/092910792271136
03/1035222141351148
03/11286421232732
03/12251031114330
03/13126233211115
03/14281283925231137
03/156311115213
03/1674422212317
03/172691461712731134
03/1824672331181436
03/1922581745125
03/203061015415321139
03/21213
03/22202913124
03/238151131117
03/241581032311330
月日\語安倍森友籠池塚本国有地稲田昭恵教育勅語ノイホイOR菅野蓮舫スーダン赤旗口利き辻元いずれかを含む
Total Result6753521491371266463563323191254929

本当はフレンズ語録を見たかったのだけど、ここの11人は一週間もたずに6日で飽きていてつまらなかったので方向転換。フレンズフレンズでも一週間フレンズ。かよ。

2017-03-23

[][]増田には1日

平均750件のエントリ投稿される

合計11万字を越え、本を一冊読む量に相当する

1エントリの平均文字数は157文字(改行込み、以下も同じ)

しか中央値は64文字

一部の長文を書く人が平均値を押し上げている

平均文字数が多い時間帯は朝の5時、6時台。次いで深夜0時台。

平均文字数が少ない時間帯は朝9時、昼2時。

最頻値は13文字(改行抜いたら12文字)

"お前なんか勘違いしてるよ"

"は?誰だよお前くたばれよ"

"それ発達障害だよ・・・。"

"ねこみこれいむあいしてる"

こんな感じ。575すら長過ぎるようだ

(集計期間2017/02/23から2017/03/22まで)

ログイン ユーザー登録
ようこそ ゲスト さん