GoogleやTwitterで時事的な言葉を検索したときなどに、検索のノイズとなりがちなのが2chをコピペしただけのまとめブログ。数だけは多いのにぶっちゃけ大抵は得るものがなく、ハッキリ言ってくそうざい。だから除外したいことが多い。今までは検索クエリに逐一「-esuteru -jin115 -hamusoku -dqnplus -alfalfa …」みたいに面倒くさいことをしていた。本当に面倒くさい。
そういえば、2chコピペブログの8割ぐらいはライブドアブログ、残りの大半はFC2ブログだ。
じゃあ「-livedoor -fc2」である程度削れる? 答えは否。ここ最近は独自ドメインを取ったコピペブログが多く、逆にたちの悪いサイトは痛いニュース以外だいたい独自ドメインなので思うようにいかない。
そこでいいこと思いついた。「-archives -blog-entry」ってやればいいんだ。
うおお、なんて見やすい!! (どちらのブログでもない、よりによって News U.S. が除外できていない一点だけは閲覧注意)
これで今のところ検索結果から95%以上のコピペブログの除外に成功してる。まだアンテナ系とかがたまに引っかかるが、これは気になったときに -アンテナ すればいいだけかなと思う。みんなもぜひやってみて。おすすめだ。
news-us,Naverが残るし、はてなもぶっちゃけ邪魔。完全除去への道は難しいよな
個人ブログが消えるから、感想系調べたいとき困るんだよね