私はネットウォッチャーとして様々なサイトを漁っている一介の増田である。面白いサイトを見つけるためにGoogle alertを利用しているのだが、少し前からGoogle alertを狙うと思われるspamサイトに苦しめられているので紹介したい。
一例を示そう。xyzドメインで、「LIGO 重力波」で検索する。
検索結果は以下のURLで示すように、dcrwns.it.xzuvdspcp.xyz というドメインが表示される。
画面キャプチャ: http://www.fastpic.jp/images.php?file=3101744883.png
しかし、このサイトにアクセスすると、以下のように http://dcvb.sytes.net/dcrwns.it.xzuvdspcp.xyz (魚拓)にリダイレクトされるのだ。
画面キャプチャ: http://www.fastpic.jp/images.php?file=0078597575.png
このサイト、主要なコンテンツはYahoo!知恵袋からの引用で、「続きを読む」クリックすると、以下の質問にリンクしている。
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q10158380025]
つまり、この dcvb.sytes.net というサイトは、Yahoo! 知恵袋をパクったspamサイトなのだが、なぜかこのサイト上のページには以下のように検索避けがしてある(タグ文字は全角で表記した)。
<meta name="robots" content="noindex,nofollow" >
すなわち、この dcvb.sytes.net 自体は検索ではたどり着くことはできず、必ずリダイレクトによりたどり着くように設計されているのだ。
そして、Googleで表示された dcrwns.it.xzuvdspcp.xyz というサイトだが、単にアクセスするとリダイレクトするだけなので、Googleのロボットにキーワードが収集されるはずがない。
ここからは増田の推測だが、リダイレクト用のサイトは、次のように、Google botか否かで表示を変えているのではないか。
なんとかしてGoogle botと同じ内容を見てみたいと思い、Googleキャッシュを確認しようにも、キャッシュは表示されない。noarchive設定がされているのだろう。細かいところまでよく考えられている。
リダイレクトに用いられているドメインだが、以下のように非常に多数だ。
これだけで18ドメインある。お名前.comだと一つ99円で大安売りしているので、漏れているものをいれても 2000円位だろう。それだけ費用と手間を掛けても、それを上回る広告収入が入るのだろう。
どうもお手上げだ。誰か助けてくれ。
どうやってるかはオトリサイト立ち上げればわかるだろうけど、google botを再現するのは難しくない? どんなソースなのかは俺も知りたいw
dcvb.sytes.netというspamサイトで報告していたGoogle alert spamサイトだが、その後変化があった。 まず、このサイトが Google八分にあい、Google検索で一切引っかからなくなった。徳丸さんが報告...