2013-04-20

世界初はてサ自動的に抽出するアルゴリズムを開発した

 

問題提起

日本インターネット固有のノイズであるはてサ」と呼ばれるユーザーをできる限り簡易な方法で特定したい。

仮説 

産經新聞の記事のブコメに「産経」という単語を書いてる場合ユーザーはその記事における産経立ち位置スタンスを批判している場合が極めて高く、従ってそのユーザーは、はてサである可能性が高いという仮説を立てた。

 

検証

京都玄関口で排泄物垂れ流し、すさまじき悪臭…“異常”なのに「人権」で動かぬ京都市当局 - MSN産経west

http://sankei.jp.msn.com/west/west_life/news/130420/wlf13042012010008-n1.htm

http://b.hatena.ne.jp/entry/sankei.jp.msn.com/west/west_life/news/130420/wlf13042012010008-n1.htm

この記事でブコメに「産経」と書いているユーザーは6人。(記事タイトル引用している関係上で産経という単語が入っているブコメは除く / 2013.4.20 21:00現在)

そのユーザーブコメ履歴・ダイアリーハイクを辿った結果、6人全てがはてサであった。

結論

極めてシンプルで手間のかからない方法にも関わらず高精度にはてサ抽出できる方法が実証されたことは大変喜ばしく、人類はより良き世界へとまた一歩近づいたと言える。今後この手法さらに洗練・大規模化してはてサ抽出精度を高めていきたい。終。

 

(付録)検証に用いたコメントデータユーザー

umeten 産経がひどいってことは言わずもがな。なんだこのネット右翼レベルカキコ(もはや記事ではない)は。

armonias 精神疾患を抱えたホームレスの行き場がないという話で、なぜか人権を叩く産経

hobohate 人権関係ない。受け皿がないことが問題なのに論点ずらしてあえてそこはスルーする産経の書き方が異様。

hennaojisan よっぽど産経人権が嫌いなんだな。死ねばいいのに北朝鮮メディアみたいだな。これは保護すべき案件なのに、文章の筆致が人権保護は悪と見せかけるミスリード。この記事書いたゲスの顔を見たい。

aya_momo 「人権」って言ってるのはJRじゃん。人権で動かせないというのはこの記事ではわからない。産経の決めつけかもしれない。

unaken 「京都」「汚物」「人権」というワードを一つの記事に書き込めた時点で、産経としては目的達成なんだろうな。

記事への反応(ブックマークコメント)

人気エントリ

注目エントリ

ログイン ユーザー登録
ようこそ ゲスト さん