はてなキーワード: スパム対策とは
今日もまたスパムSEO業者の仕業で「くちらぼ」の記事がバズっている。。
http://b.hatena.ne.jp/entry/kuchi-lab.com/white-teeth-3346
ブクマ垢をよく見ると、
はてブスパムの為に作られた垢だから、ブクマ数が一桁や二桁しかない。
b:id:m3614028 などなど。
ググッてみて欲しい。
この「くちらぼ」は先日1,000ブクマ超えのスパムを行った。
奴らの過去の実績ページはこちら。
バズ部成功事例
(魚拓)
http://megalodon.jp/2016-0819-1333-08/bazubu.com/case
「成功事例」として載せているが、はてブスパムの成功事例と言えよう。
「人気順、新着順、すべて」で人気順で100以上のブクマが付いている記事をよく見てみると、スパムアカウントによるブクマが目立つ。
よーく手口を見て欲しい。
メディア立ち上げ初期に、一気にブクマを付けてSEOで上位表示させる。
(これでコンサルフィー初期300万、月額50万ほど企業からとっている。)
話を元に戻そう。
しかも10記事程度の時に1000以上のはてブスパムを行っている。
http://b.hatena.ne.jp/entrylist?sort=count&url=kuchi-lab.com
こんなスパムを許して良いのだろうか?
多分消されるだろう。
ただ、コメント数が増えれば諦めるだろう。
ブクマ数が異常に少ない。
今までのブクマした日数が1日~3日程度。
「お気に入り」「お気に入られ」が無いか、スパム垢同士しか無い。
が、
ここで全てを明かすと、スパム業者に「判断基準」をクリアされてしまうので控えたい。他にもいくつかある。
一つサブ垢でスパム対策アカウントを作成し、運営していきたいと考えている。
はてな公認のスパム対策アカウントがあると良いのだと思うが。。
スパムを見つけたら、すかさずスパム対策垢でスパムタグをつけて行きたい。
そして、他の方のスパム対策アカウントを見つけ追っていきたい。
今回のブクマコメント欄、魚拓が崩れてしまうが一応残しておく。
http://megalodon.jp/2016-0819-1250-29/b.hatena.ne.jp/entry/kuchi-lab.com/white-teeth-3346
そのアカウントを捨てまた別IPでサブアカウントフル動員でブックマーク。
すべてのブクマの新しい方を見てもらえばわかるが、
http://b.hatena.ne.jp/entry/spotlight-media.jp/article/304114885455366584
法則がわかるだろうか?
全員がそうとは言い切れないが、このタイプはアカウントを捨てず継続的にバレないよう少数ブクマするタイプである。
次にこのエントリー
http://b.hatena.ne.jp/entry/www.youtube.com/watch?v=Ir8xLSoz8VI
6文字の人の名前+かぶらないように数字をどこかに入れる+あとで読むタグ
出現頻度が少ないが
http://b.hatena.ne.jp/entry/baito2ch.com/332
厄介なの2番のタイプで春過ぎからずっと運営は対処のしようがない状態が続いている。
私も報告はし運営もアカウント停止をしていたのだが、次から次へ湧いてきて私は諦めた。
そもそも2番のタイプは目立つ代わりにアカウントを維持する必要がない、そして対象をブーストできる。
ともあれわかることは個人で簡単に持ち上げれることだ。
気づいてから折れるまでアカウントをメモしながら運営にスパム報告してたが、
運営としても誤判定で事故になることは避けたいので停止にならないタイプはある。
1番目は一日のブックマークが少なく継続してるため基本停止にはならない
2番目は短期型かつタイミングも重複しやすいので停止にはなってるが意味が無い。
3番目はブックマーク数から捨て覚悟っぽいのだが、ブクマ時間ずらしと無関係タグ付けのおかげで停止にはなってない。
2回も増田に投稿されてるけど、どうもこの動画の人達は海外のユーチューバーっぽい。
でもこの動画の人は他の動画は日本に対してポジティブなものが多い印象なので違うっぽい。
759 : 名無しさん@お腹いっぱい。 (ワッチョイ aa83-s/+K)[] 投稿日:2016/06/07(火) 19:45:18.52 ID:C5YjExBh0.net [1/2回]
以前にジャパンタイムズで
「レイシズム・イン・ジャパン」などという動画を作る人がいるが
Say, people make videos called “Racism in Japan!” It’s like, why do that?
Why don’t you just share something positive? I don’t see any point
in spreading more negativity. They just want to do that
because if it’s controversial, they’ll get money.
http://i.imgur.com/DZNIkO9.png
http://www.japantimes.co.jp/life/2015/02/23/digital/sharla-japan/
じゃあ、これらもやっぱり「炎上商法」なんですよね?
Sharmander
http://i.ytimg.com/vi/8UET38Ze4pY/mqdefault.jpg
kimdaovlog
ttp://www.logsoku.com/r/2ch.sc/streaming/1431358818/759
この件とは直接関係ないけど、youtubeに「RACISM IN JAPAN」みたいなタイトルの動画で再生回数が結構あるのが多かったのでそういう一面はありそう。
5 : 名無しさん@お腹いっぱい。 (ワッチョイ 3b4f-dm/8)[] 投稿日:2016/06/11(土) 23:12:52.08 ID:66QX3Cfc0.net [1/1回]
削除されたコメント、目立ってたやつだけ。
ttp://www.logsoku.com/r/2ch.sc/streaming/1465542119/5
779 : 名無しさん@お腹いっぱい。 (テトリス fabc-zAhY [183.181.168.48])[] 投稿日:2016/06/06(月) 09:01:45.88 ID:fM0CTS6q00606.net [1/1回]
ttp://www.logsoku.com/r/2ch.sc/streaming/1463733553/779
兎にも角にも、元動画が非常にわかりにくいのが問題の根幹だろう。
人種差別をしているのかどうかわかりづらい状況なのに、インパクトの強いタイトルをつけ画像や動画をネットに投稿しているのが問題を複雑にしているようだ。
日本の狭いネット界隈の話に限って言えば、このユーチューバー側についている人たちとネトウヨ系の人たちが揉めているようだ。
増田に投稿したのは多分ユーチューバー側の人達がバズるのを狙ったのだろう。
雑にまとめたから事実誤認がありそうだけど、面倒くさいからこれぐらいにしておこう。
※途中、URLをh抜きしているのはスパム対策のためか増田の一記事中にURLの個数制限があるらしく投稿出来なかったので、数を減らすためにh抜きしました。
互助会がホットエントリーに上がらないようにするには、互助会をスパム扱いとすればいいけれど、どこからが互助会でそうでないかは人間にも明確な判断基準が無いからそれは難しい。
いまのホットエントリー入りのアルゴリズムがクソなので、本来の目的である「良い記事をホットエントリーに上げる」ということに注力すればいい。
「良い記事を早くブックマークするのは良いユーザー」「良いユーザーは良い記事を早くブックマークする」という、循環的なアイディアがある。
ユーザースコアははてブのフォロワーとか、機械学習を利用すればブックマークした記事や時間から算出することができる。
そしてブックマークしたユーザースコアの合計を記事のスコアとしてつける。
後は、今のホットエントリ入のアルゴリズムと同じように、一定時間で一定数の記事スコアを獲得した記事をホットエントリ入りとする。
この仕組でもスパムは可能だが、アカウントが大量に必要になるので、別方面でのスパム対策(スパムアカウント対策)で済む。
またユーザースコアの高いユーザー複数が共謀してブックマークするすることでも互助会的なことは可能だが、あまりその可能性は無さそう。
炎上対策についてはブックマークごとにユーザースコアの価値を最初の3ユーザーは100%の価値、次の10ユーザーは90%の価値、と下げていけばいい。(この辺りはRedditのスコアに似た考え方)
自分の作ってるサービス(bh.mgzl.jp)では機械学習でユーザースコアの算出できていない。(実現には膨大なAPIのコールが必要。)
そのかわりフォロワー数とユーザーの総スターをユーザースコアの算出の基準にしている。ただ、スターがユーザースコアに与える影響はとても小さい。1000スターで0.1上がるとかそのレベル。
残念ながら「良いユーザーは良い記事を(早く)ブックマークする」の部分が実現できていないのと、現状のホットエントリーに記事スコアをつけて表示しているだけなので、「良いホットエントリー」にはなっていない。(それでも「マシな感じ」くらいになるように調整し続けている。)
別に統計学をやってたとかそんなんでも何でもないので、破綻している部分もあるかもしれない。
ただ、RPGの与ダメージの様にみたいに足し算をするだけでなく、複雑に計算しないと上手く行かないと思う。アルテリオス計算式みたいに。
ブコメに返信
スター数とお気に入られ数は無駄に多いがキュレーション能力がクソザコナメクジレベルの人もいるので。誰とは言わないが。誰とは言わないが。
いまこの辺りを基準にしている理由は、他に容易に手に入れられそうな指標がないからだったりします。表にでてる指標で良い指標がないんですよね。
ちなみに自分のサービスのユーザースコアは、いろいろ計算して最大3.4、最小-0.5くらいの幅になってます。お気に入られ1000の人と100の人と1の人に差がつけられればいいので。
たぶん既にハテブには独自の良質ブクマ選定機能がある。私はあまりコメ残さずフレ少ないが、技術系や法律系を自分がブクマすると、翌日なぜかホッテントリ浮上する事が。特定分野を集中的にブクマしてると起きる傾向
実際のホットエントリーのアルゴリズムはブラックボックスなのでよくわからないですよね。ブラックボックスにしないでもスパムに食われないアルゴリズムができればいいんですけどね。Googleですら出来てないので無理でしょうが。
このアイディアは「スコア」という単一の指標ですが、「おもしろいブコメをする人」「技術的に優れた記事にブクマする人」みたいなベクトルに分けてもいいかもしれないです。
価値の無いブクマの線引きを固定パラメータですると、結局スパマーに見つかって終わるのでダメでしょうね。1つのパラメーターだけでスパマーに対向するのは無理なので、複数の評価が大事です。本文のアルテリオス計算式の話はこの辺りのことを言ってました。
直近のブクマに関しても、容易に回避可能なのと単にドメインが同じだけ(ニュースサイトとかqiitaみたいなサービスとか)なのか判別不能なので害しか無いでしょう。
更に返信
NGリスト方式だと、無限にNGが増えていってそんな面倒なことをやりたくないってのが大きいです。面倒くさがりなので何もしないでもいい記事だけが上がってきて欲しいのです。
良いユーザーの決め方は、最初は何かしら人間が基準を用意する必要がありますが、その後はブックマークから抽出できるはずなので、動かしてしまえばなんとかなるかと。
最初の基準は、それこそお気に入られ数とかスター数とかわりと適当でいいんじゃないでしょうか。自信はないですが。