「クローラー」を含む日記 RSS

はてなキーワード: クローラーとは

2017-11-13

weblioってWikipediaから情報取ってきてるのか

weblio辞書百科事典Wikipedia記事全てがクローラーで取得される

weblio辞書に載っているのでWikipediaコンテンツweblioコンテンツになる

weblio英和辞典や和英辞典意味などでweblio辞書の内容が使われる←ここでのWikipediaからの出典などの明記無し

これ良いの?

2017-10-27

祝・ブログ登録1日経過!

Googleクローラが来てくれました!

アクセス数は300%の増加になりました! つまり4!


大昔はてなダイアリーがあったころはダイアリートップに「新着更新一覧」があって、ボットでもタイトル誤読勘違いでもなんでも一応の水増しアクセスがあったもんだけど

クローラーとかそういうの排除してだいたい人力のアクセスだけきちんとカウントするようになってると現実の風がなかなかに冷たいな

……いや、いまのとこ特段有用コンテンツもないんで、逆にこんなんでたくさん来てもらってもんああああああってなるんだけども

どこだかのブログサービスの「画像でもなんでもアカウント名のコンテンツへのアクセスがあったらとにかく1と数えるカウンター」あたりは嘘だらけだけど優しいのかもしれん

2017-10-12

Googleにデコイを食わせろ!

「よろしい、ならば戦争だ」

Google検索と戦う方法を紹介します。

デコイ

デコイ(英: decoy)は、狩猟で囮に使う鳥の模型。これが元来の意味である

デコイ英語: decoy、Military dummy、囮とも)は、敵を欺瞞して本物の目標と誤認させる目的で展開する装備の総称

ネガティブSEO

リバースSEO」や「ネガティブSEO」とも呼ばれる逆SEO

逆SEOとは、特定サイト検索順位を下落させること

Matt Cutts氏が指摘するように、順位を下げるために付けたリンクが、期待とは正反対順位を上げる手助けをしてしまうこともあり得なくはありませんね。

リンクされているサイトではなく、リンク元サイトスパムかどうか判断していることをGoogleゲイリー・イリェーシュ氏がMarketing Landポッドキャストで明らかにしています

この説明にもネガティブSEOの具体例をあげて解説していることからペンギンアップデートネガティブSEO対策に力を入れていることがうかがえます

方針

  1. ネガティブSEOではなく、ポジティブSEO採用する。
  2. ポジティブSEOデコイを大量に投下する。

あなたプログラマーではない場合(手動)

  1. あなた名前を付けたブログTwitterアカウントを作る。(例:はてな次郎のダイエット日記
  2. 質の良い情報必要なので、趣味や特技を活かしたテーマ記事を書く。(例:スムージーオリジナルレシピを紹介)
  3. 業界有名人積極的メッセージを送る。(例:料理家・平野レミさんのちくわストローで飲むティスムージーレシピ感想を送る) https://twitter.com/Remi_Hirano/status/759208574694359044

 

目的は「はてな次郎」の文字列自分管理して、インターネット上に増やすこと。

 

  1. ブログ記事動画にして、YouTubeにアップする。(YouTuberビデオブログ
  2. ブログ記事書籍にする。(例:Amazon KindleAmazonオンデマンド印刷本)
  3. 書籍オーディオブックにする。(例:Amazon Audible

 

目的は「はてな次郎」の文字列を爆発的に増やすこと。

 

セルフプロデュースセルフブランディングするのがポジティブSEO王道です。

現在、「はてな次郎」をGoogle検索したら1万件ヒットする場合セルフブランディングした情報が3万件ヒットするぐらいを目指してください。

はてな次郎」に関する誤情報が、検索結果の10ページ以下に沈めばとりあえず成功です。

あなたプログラマー場合自動

はてな次郎」という文字列インターネット上で増殖させる作業を、手動ではなく自動で行うことも可能です。

 

  1. クローラー」を作り、Web上のデータ収集する。
  2. AI自然言語処理データを加工する。
  3. 加工したデータをもとにポータルサイトを作る。

 

(例)有名人応援するファンサイトを作り、各ページのタイトルやヘッダーに「はてな次郎」の文字列を入れる。

  1. Amazon商品データスクレイピングして、本=著者、CD歌手DVD監督俳優人物データベース作成する。
  2. その人に関する情報スクレイピングする。(DBディアAPI、あのひと検索スパイシーを参考にする)
  3. 日本語英語日本語の往復翻訳をするなどして、オリジナルデータを少し改変する。
  4. 人物に関するデータから、その人物の三行紹介を作成する。(マルコフ連鎖圧縮新聞のような記事を生成する) http://pha.hateblo.jp/entry/20071124/1195904502
  5. 自分が好きな歌手女優なら、自分で紹介記事を書いても良いです。(手動の作業も加えてOK

 

このような方法で、100万ページ程度のWebサイト自動的に作れます

データや加工方法を変えて、さらWebサイトを作れば「はてな次郎」の文字列インターネット上に1億個以上投下することも可能です。

いいね工場

アメリカ大統領選挙ロシア情報操作を行っていたと言われている「ロシアゲート事件」を参考にして、SNSデコイをばらまくことも可能です。

  1. 安いスマートフォンSIMカードを大量に用意する。
  2. SNS操作する専用アプリを作る。(DeployGateやTranspoterPadのようなデプロイツールを利用)
  3. はてな次郎」の情報自分で作ったブログWebサイトSNSアカウントなど)を拡散したり、いいねを送る。

 

ユーザー陳情を受付けないGoogle傲慢ですね?

やりたい放題のGoogleをブッ飛ばすには、プログラミング有効です。

頑張ってください。

 

追記

記事仮名が変更されたので本記事仮名も変更しました。(はてな次郎)

 

補足:

はてな次郎」の文字列自分管理

自分が書いた投稿なら、必要に応じて(自分権限で)表示/非表示を切り替えられるので管理上都合が良い、という意味です。

同じ問題で困ったことがあったので私が対処した方法を書いていくね

https://anond.hatelabo.jp/20171012023346

私の場合情報商材屋に実績貸し(名義貸し)をしてしまい、怪しい情報商材関係者として名前が出てしまった。

一応今はほとんど削除できたので、私が行った方法ざっと書いてみる。

名前キーワード)を削除したのに検索結果に表示される問題

自分も同じような対処をしたんだけど、Googleクローラーがはやく回るサイトだとすぐに消えた

3年ぐらいずっと消えないページもあったんだけど、Googleボット巡回してもらうために、そのページをはてブしたり、リンクを送ってあげたら1ヶ月ほどで消えた

本名で色々なサービス登録して検索結果1ページ目から追い出す

TwitterYoutube、インスタ、About.me、ツイプロGoogle+など本名登録できるSNSアカウントを作り、それぞれのURLはてブするなりしてGoogle認識させると大体上位表示されると思う。

はてブは非公開アカウント大丈夫

うまく消えるといいね

自分名前でググられて勘違いされたりして何度も嫌な思いをしたので解決することを祈っています

Google人生破壊された

煽りタイトルだけど偽らざる本心なので。


何があったか一言でまとめると、

無関係他人炎上に巻き込まれ誹謗中傷された挙句、元ページを削除しても永遠にGoogle検索結果から消えない」

ということがありました。

最悪です。

Googleは全く対応してくれる気なさそうなので、万に一つでも増田話題になってくれれば何か違うかもしれないと思って書いてます

あと単純にWEBに詳しいはてな村の人たちの知恵を貸してほしい、マジで…。






経緯

1)無関係他人炎上に巻き込まれ

 同じ職場の似たような名前の別人(仮にはてな太郎とする)が悪事を働く

  →これってはてな次郎(これも仮名だけど俺の本名と思って読んで)じゃね?という感じで、俺が犯人ということにされる

  →誹謗中傷され、個人情報をあさられる

2)スレッド過去ログ倉庫に行くのを待つ(変に燃料追加したくなかったので)

3)無事過去ログ倉庫に送られたが、「はてな次郎」の検索結果にスレッドがヒットしてしま

 スレッドタイトルはこれも仮で悪いけど

 「一部上場企業連続レイプ犯がまぎれていた件www

 みたいな感じのゲスものだと思ってください。

4)弁護士に依頼して、該当スレッドから俺の本名はてな次郎)を削除してもらう

 この時点でかなり高額な費用がかかり、俺涙目

5)Googleキャッシュスニペットを削除する

 キャッシュキャッシュスニペット検索したとき

 ページタイトルの下に出てくる数行の説明みたいなやつです

 ※※ここ重要なところ※※

6)まだページタイトルだけは検索結果に出るが、しばらく待てば消えるだろうと思って放置

7)一年待つ

8)……消えねえええええええ(しか検索結果に1p目に表示される…)


何が困るって、該当スレッドからは「はてな次郎」っていう本名こそ消えてるんだけど、

知人が読んだら「これってはてな次郎じゃん」ってわかる内容なんだよね


特定されたくないからぼかすけど、

「このレイプ犯ってやつ、企画課の一番背高いやつじゃね?」みたいな感じで

想像してみ?自分本名ぐぐると1p目に

 「一部上場企業連続レイプ犯がまぎれていた件www」って出てくることを…

つらすぎ…


原因はおそらく、該当スレッドが、

Googleクローラーにとってめちゃくちゃ優先度が低いため、

何年待ってもクロールされず、インデックス更新が行われないこと。


平たく言うと、クローラーってロボットがいろんなページをくまなく探して、

そのページにどんな情報があるかをGoogleに報告して、

それを「インデックス」って読んで、検索結果に出るようにしてるっぽいんだけど、

クローラー全然来ないから、

「このページには はてな次郎 って情報がある」って誤ったインデックスが、

一年経っても更新されていない。

(か、そもそもGoogleインデックス更新システムバグってる)


から今俺にできるのは

該当ページがクロールされる可能性を少しでもあげること……。

2ch側に

「このページがクロールされるよう

ウェブマスターツールってのを使って対応してくれ」

って頼むことも考えたけど弁護士に「明らかに無理」って言われた)


以下、試してみたこと。

※※状況が複雑なのと、

まさかGoogle検索がそんなバカなはずがない」という正常化バイアスがあるせいで、

以下のようなアドバイスめっちゃしてもらうんだけど、

どれも効果なかったので一読してみてほしい


・ページ内に本名が実は残っていないか検索したら?ソースコード

 →CTRL+Fでくまなく探したけど残っていない

・どっかのページからはてな次郎」ってリンク張られてるんじゃないの?

 →そういう場合は「リンク貼られてます」って表示が出るらしいけどない

キャッシュスニペットを消すならここから消せるよ!

https://www.google.com/webmasters/tools/removals

 →キャッシュスニペットはもう消えてる。もう消えてる(二度目)

検索結果の一番下に出てくる「フィードバック送信から

検索結果おかしいよ!って送ればいいよ

 →何十回と試したけど効果なし

クロール巡回を促進できるページがあるよ!

https://www.google.com/webmasters/tools/submit-url

 →何十回と試したけど効果なし

  ていうかこのページがまともに機能してくれれば全部解決じゃんかよなんとかしろGoogle

Google名誉棄損だから消してくれっていいよ ここからできるよ

https://support.google.com/legal/contact/lr_legalother?product=websearch&uraw=

 →ここに最後の望みを託して依頼したんだけど、

  結果からいうとマジで不誠実な対応しかしてもらえませんでした。

  どれくらい不誠実かというと返信が全部コピペの上に、会話が噛み合わないの。

  あまりにもひどいから以下引用


俺、Google検索結果からの削除をお願いする

返信(長いので一部抜粋

このサイトに対して法的措置を講じられ、結果として問題の素材が削除された場合

その変更が Google検索結果に反映されるのはサイトの次回クロール後です。

ウェブマスターによる変更後、早急にキャッシュの削除をご希望場合は、

ウェブページ削除リクエスト ツールhttp://www.google.co.jp/webmasters/tools/removalsから

リクエスト送信していただきますようお願いいたします。

俺、「だからそれはもうやってるって。

それでもクロールされてないっぽいから依頼してるんだって

クロールしてくれ」

返信(一部抜粋

懸念はお察しいたしますが、Google では、

検索アルゴリズムを手動で上書きして、

対象URL がご指摘のキーワード検索結果に表示されないようにすることはありません。

Google では、ご要望のあったような形で特定キーワードに対する検索結果を変更することはしない方針です。

名前検索したときに表示されるサイトは、検索キーワードの中の単語の組み合わせ、

文書の内容、その他の数多くの要素に基づき、Google検索アルゴリズムによって関連性のある結果として選定されたものです。

ときには、検索キーワードとの関連性が最も高い結果であっても、検索キーワード内の単語のものを含まないこともあります

俺、「検索結果を恣意的に変更してくれって言ってるんじゃない、

該当ページをクロールしてくれ…頼むから…」

返信(一部抜粋

検索結果の情報サードパーティウェブページにはもう表示されていない場合は、

Googleキャッシュが徐々に更新され、最新のコンテンツ検索結果に反映されるようになります

俺 「だから一年待っても反映されないんだって!!!


という流れです。


いや言いたいことはわかるよ!?俺も社会人から

いちいちひとりひとりのユーザー要望に応えて

検索結果をいじったりできないっていうのはわかるよ!


でもさ!アフィブログとかのコピーサイト

サジェスト汚染とかはあっさり対応してもらえてるじゃん!

検索すればいくらでも例が出てくる)


アフィブログとかのコピーサイト問題よりも

俺の人生って軽いですか!?

上のメッセージでは省いているけど、

必要であれば顔写真付き身分証明書などの書類も提出できます

ってお願いしたんだよ!?!?!?


おそらく、

一年だと短いのでは、あともうちょっとだけ待てば?」

という反応があると思うんだけど、

Google検索フォーラムというところで過去事例を探したところ、

同じような苦しみ方をしている人がたくさんおり、

三年以上待っても消えないという人もいました


一例

https://productforums.google.com/forum/#!topic/websearch-ja/jR3-1mfWciA;context-place=starred

https://productforums.google.com/forum/#!topic/websearch-ja/42c3-xqvgn4;context-place=starred

https://productforums.google.com/forum/#!topic/webmaster-ja/Q5qv_7d8skw;context-place=starred

もっといっぱいある(マジで無数にある)けど

わかりやすいのだけ…


これだけ定期的に同じような苦しみ方をしている人間がいるので

Google問題を把握していないわけがないと思うのですが

なんら!一切の!対策はなし!!!!!!

俺の人生なんだと思ってんの!?ゴミだと!?


上記フォーラムで一番参考になったのはこれ↓

https://productforums.google.com/forum/#!topic/websearch-ja/ORA9iVvsa2g;context-place=starred

> 「2010年7月なので、既に3年以上経過してい」ようと、そのクソ中のクソサイト/ページがグーグル検索システムにとって1/9999京の価値もなければ、10年でも50年でも、1度も再クロールされず、したがってその不都合文言検索に出続けるでしょう — いま現在まさにそうであるように。


とのことです。

10年後も50年後もわけのわからない汚名を着続けるわけですね ははっワロス


以上のような流れでマジで死にたいくらい絶望してたんだけど、

人力検索はてなでは思ってた百倍くらい親身になって考えてくれてマジで感謝だった

お前らがいなかったらやばかった、本当ありがとう

http://q.hatena.ne.jp/1507301385

口調全然違うけど俺だ


以上が事の顛末になります

2chには何も期待してなかったけど、

まさかGoogleっていうちゃんとした大企業

こんなクソみたいな対応してくれないとは思わず

マジで絶望していました


願わくば少しでもこの増田がたくさんの人の目に触れて、

はてな村にいるスーパーハカーが知恵を授けてくれますように…

もしくはGoogle社員の目に届いてGoogle社員が猛省してくれますように


から頼む!!!!!みんなブクマしてくれ!!!!!!ください!!!!!!お願い!!!!!!!!



以下余談

・厳密にいうと、ページの中にはてな次郎の「はてな」だけは残ってるんだけど、

それって、「はてなって食べると美味しいの?」みたいな、俺の名前とは無関係文脈で、

一般名詞として使われているので、たぶん関係ないと思う…

そんな珍しい苗字じゃないしそこだけで検索1p目にヒットするのはおかしいと思う…

・たとえば、「富山 観光」って検索して、

富山温泉」のページがヒットするみたいな、

ページの中に「観光」っていう言葉はないけど当然連想されるよね~みたいなことだったら

まだ諦めもつくんだけど、そういうんじゃない

全然有名人じゃないし示唆されるような情報もない

っていうか俺の名前検索して俺本人(いや俺は犯人じゃないんだけど)がヒットするのそのページだけだし

だんだんGoogleそんな悪くないのかも?俺の被害妄想かも?」って気もしてきた

でも今マジでへこんでるのでブコメあんまり厳しく言われたら悲しすぎるのでそういう場合はやんわり注意してください…

でも俺かわいそうじゃない…?

※※追記

みんな本当にありがとう

林さんに迷惑という意見を見たのでひとまず名前だけ変更しま

2017-08-29

FF5忍者に青魔法をつけるメリットについて語る

忍者+青魔法が強い理由

忍術が無強化タイタン並に強くなる

忍術攻撃力は120、タイタン攻撃力は110なので、魔力の差はあるが同等。

しか無効化されることもほとんどなく、先制で2人で投げれば一瞬で敵を殲滅できる。

忍術を大量に買っておけば、タイタンと違ってMP切れの心配もない。

そのためボタン押しっぱなしで戦闘サクサク進み、ギル経験値もABPも稼げる。

投げるを覚えたら召喚士に変えると威力が上がるが、後衛忍者にして高い素早さから全員で投げまくるという手もある。

敵を無力化する技が多い

暗闇・カエル麻痺MP切れ・レベルダウン・老化・睡眠小人が該当。

優位性があるのはミュートとストップが使える時空だけ。

融合で早期から味方のMPを全回復できる

融合には実はMP回復効果もある。

MP回復する技としては最速で覚えられる。

これに匹敵するのは調合だけだが、調合はギルの消費が激しいので、第2世界後半にならないと多用できない。

融合中は安全性のために敵を無力化しなければならないが、青魔法には敵を無力化する技がいくつかあるので、何かしら効く。

忍者を使い続けることによって投げるを覚える

威力不足感が出てきた頃に投げるを覚えるので、召喚士に変えて属性強化忍術タイタン以上のダメージを与えられる。

3世界のピラミッドまでは、銭投げ以外の全体攻撃では最高威力を誇る。

それ以降はエアナイシルドラぶっ放しで。

忍者自体の打撃も強い

魔法剣士+両手持ちくらいのダメージを素で与えられる。

その上で高い素早さ+アビリティ枠があるので、そこらの前衛よりも強い。

ツインランサー二刀流エクスカリバー両手持ちに匹敵するほど。

中盤以降はツインランサー二刀流で殴るか忍術を投げるかになるだろう。

下準備

モンクで進行して格闘を覚えた後に、青魔法を覚えるまで青魔道士に格闘を付けて進行する。

1人だけでは忍術殲滅できないので、バッツとファリスを育成すること。

だいたい古代図書館あたりで覚えるだろう。

火力船あたりではナイトの両手持ちの方が2倍ほど威力が上なので威力不足感があるが、カルナック城と古代図書館はファイラ無双(※)なので、苦しいのは火力船だけである

※…エンカウントは全逃げ、宝箱は2人で属性強化ファイラが手っ取り早い。シヴァ黒魔道士で倒せば、古代図書館までの道中で黒魔法L3を覚える。

まだ古代図書館時点では忍術も買えないのでそれほど活躍しない。

リックスの村で忍術を大量に買って初めて活躍する。

忍者以外に青魔法をつけるとどうなる?

ナイト・侍
両手持ちの方が強い。
モンク
火力が低いので、序盤以外で使うことがない。
竜騎士
火力が低いので、時空をつけてクイックを使った方が良い。
魔導士系
いくつかの魔法は被るし、補助にしても遅いので忍者ほどの効果がない。

忍術威力上昇・後列ゴブリンパンチ・高い素早さからの補助と、相乗効果で強くなるのが忍者だけ。

忍者に他の魔法アビリティをつけるとどうなる?

魔法
魔法以外では最も役立つが、道中なら青魔法+アイテムと被る。
魔法
攻撃魔法を使うことがないので、ほとんどメリットがない。
魔法
まり魔力強化されない。白魔法の方が良い。
時空
まり魔力強化されない。道中では時空を使うほど時間がかからない。
召喚
魔力強化値が最大なので、手っ取り早く忍術威力を上げるにはあり。道中ではエアナイシルドラしか使わない。

100ABPだけで全魔法が使えるようになるという点でも、青魔法が優れている。

入手時期順青魔法リスト

1世
ゴブリンパンチ

後列に下げられるので、忍者の打たれ弱さを解消できる。

必中・隊列無視・無属性武器特殊効果なし・二刀流時防御力半減という特徴があるので、どんな敵にも針千本の如くダメージが通る。

ツインランサー二刀流になったら流石に使わない。

スマホ版以外ではチキンナイフ攻撃力が0扱いになってしまう点に注意。

エアロ

ジャコールの洞窟ナッツイーター×3とムーア大森林のガジェラガジェリに使う。

フラッシュ

敵を無力化する系の技。

かなりの敵に有効で、しかも全体にかかる。

戦闘が長期化しそうな時に使うと良い。

吸血

自分現在HPの1/2を吸収する。(GBA版に限りフル回復になるまで吸収)

GBA版では完全回復できるのでかなり有用

それ以外ならホワイトウインドHPを増やしたい場合に使う。

後半になると当たらなくなってくる。

カエルの歌

敵を無力化する系の技。

強力すぎるためか、耐性持ちが多いように思える。

ボスガルラにも効く。

????

減ったHP分のダメージを与える。

必中ではないし、自身瀕死だし、リスクの割に低威力なので使いづらい。

融合

自身死ぬ代わりに対象HPMPを全回復できる。

利便性は前述の通り。

最速習得は船の墓場カルキュルスルにコンフュ。

エアロ

弱点を突いても忍術の方が強いので使わない。

デスクロー

いくつかのボスに効きやすいので、先制で掛けて殴って瞬殺できる。

後半だと無耐性でも効きにくくなってくる。

自爆

エクスデス1回目とアポカリョープスが1ターンで終わる。

アクアブレス

砂漠の敵に大ダメージ

サンドウォームも一撃。

はいえ消費MPが大きいので、流砂の砂漠では忍術で良い。

二世界ではサンドクローラー有用だが、一撃では倒せないのでブレイクの方が手っ取り早い。

レベル5デス

最初から効くのは蘇生後アルケオエイビス・アダマンタイタイ石像くらい。

アトモスは黒の衝撃、エクスデスレベル2オールドも組み合わせる。

ガードオフ

防御力を半分にする。

普通に殴った方が手っ取り早いので使わない。

月の笛

味方全員がバーサク状態になる。

全員前衛でないと意味ないし、わざわざ使うほどでもない。

マジックハンマー

敵を無力化する系の技。

MPを半減させる。

ボスに連発するくらいなら普通に攻撃した方が手っ取り早い。

黒の衝撃

敵を無力化する系の技。

レベルを半分にする。

これによってレベル魔法が効くようになる。

レベル下げが目的ならこの後にレベル2オールドの方が良い。

ミサイル

対象HP3/4分のダメージを与える。

デスクローより当たりやすいので、ギルガメッシュ1回目に使う。

火炎放射

ファイラと同じ威力

火遁の術の方が強いので使わない。

炎の指輪自己回復という手もあるが、わざわざそれをすることもないだろう。

ホワイトウインド

自分HP分の全体回復ができ、リフレクも貫通し、青魔法なのでミュートでも使える。

魔法不要とまではいかないが、高い素早さの忍者が使えるのはかなり便利。

自己融合でMP簡単回復できるので、ケアルラのごとくガンガン使える。

2回目のギルガメッシュ戦でミュートをかけた時の全体回復に便利。

千本

期間限定ではあるが、手裏剣属性強化忍術を除いて最高威力を誇る。

アルケオエイビス・ギルガメッシュ・アントリオンもこれ連発で倒せる。

レベル4グラビ

レベル系な上に即死でもなく耐性無視でもないので、ほとんど役に立たない。

2世
マインドブラスト

敵を無力化する系の技。

麻痺スリップをかけて属性強化ラ級のダメージ

融合時の敵の無力化に使えるが、ダメージで敵が死んでしまうので最終手段にすること。

麻痺は一部ボスにも効くが、麻痺が効くボスは他に瞬殺手段があるので今更ボス戦で使うことはない。

レベル2オール

敵を無力化する系の技。

黒の衝撃を使えば必ず効く。

レベル3フレア

ガーゴイル有効

アポカリョープスやエクスデスにも有効だが、もっと手っ取り早い倒し方がある。

タイムスリップ

敵を無力化する系の技。

オールド+スリプル。

スリプルは殴らない限り永続するので、ゴブリンパンチ忍術で倒せる。

エアロ

アナイフを持って使えばそこそこの威力は出るが、忍術ツインランサー二刀流の方が強いので使わない。

さなメロディ

敵を無力化する系の技。

実質的には打撃を無力化するだけ。

死の宣告

効く敵には必中だが、時間がかかるので普通は使わない。

覚えるのは第2世界だが、使えるのは第3世から

3世
マイティガード

味方全員がプロテス+シェルで、ほとんどの攻撃に対してダメージ半減。

ネオエクスデス戦やクリアボスあたりではとりあえず使っておく。

死のルーレット

エフェクトが長い・対象ランダム・耐性で効かない・味方も死ぬ

いいことがまったくない。

2017-07-25

googleにもbingにも引っかからないのに過去増田を突き止めてる奴なんなの

サヴァン?それとも増田クローラーでも走らせてんの?

2017-04-30

Web企業の闇

ここを読む人はみんな知っているかもしれないけどWeb企業の闇を書いておくね。

PVUUは金

Web企業運営するサイト基本的広告収入で成り立っている。

広告収入を増やすためにはPV, UUあの手この手で増やす必要がある。

基本的にはこれ。

PVUUを増やしお金にするために一番コスパが良い手段を選ぶのが資本主義

SEO第一主義

PVUUを増やすためには何をするかというとSEOを行う。

何かを実現したくてWebサービスを開始したはずなのに、気付いたらSEO対策を行っている。

タグなどの調整はまだしもおすすめというリンク集を作ってグーグルクローラーにとって都合の良いものを作っていく。他にも盛り沢山。

そうなってくると特定ワードでの検索順位を気にするよういなり、メインのコンテンツを増やすことよりもSEOリソースが割り当てられるようになってくる。

SEO案件には逆らうことはできない。

広告

バナー広告は良い。

ネイティブ広告が厄介。ほとんどユーザーを騙しているに近い。気付いたら広告読んでいた経験とかあるでしょ。

一般ユーザーは気付かないからね。ここまでくると行動操られている感じにならない?

キュレーション

みなさんご存知のキュレーション。本当に闇。

上記をまとめて出来上がったサイトといっても過言ではない。

キュレーションサイト運営している人たちは運営しているサイトコンテンツには詳しくない。

それなのに金をかけてそれっぽく見せているのがたちが悪い。

安いライターSEO対策マニュアルなどを読ませてSEO対策バッチリ記事を書かせる。

記事といっても他のWebサイトから引用」という自己主張のもと記事の内容や写真を「引用」して、それっぽく記事を見せている。

これで集まった人をカネに変える。アプリ誘導してネイティブ広告への誘導も忘れない。

安いコストPVUUが集められるから最高だね。

DeNA問題があったけど他のサイトはしれっと運営継続しているからね。

どこもDeNAと同じような運営しているよ。

キュレーションについてはユーザーがこの事を知っているのであろうか。

ユーザーリテラシーの低さを狙ってSEO対策を行うことでユーザー流入に繋げることで、本当に良質なコンテンツ発見されにくくなっているのではないか

Googleさんにはキュレーションサイトは一括で一気に評価を落としてもらいたい。

インターネットでの広告お金になると分かってからインターネットは変わった。

昔のインターネットを返して欲しい。

キュレーションと言われているパクリメディアは滅んで欲しい。

2017-04-28

今気付いたんだけど

自分Webサイト高速化しようと思って色々試行錯誤してたんだけど、

この高速化って結局一番メリットを被るのはGoogleだよね

データクロールする時に最適化されているデータクローラで取ってこれれば実行時間の短縮にも繋がるし

多くのサイトクロールするクローラー使ってるGoogleが一番メリットあるよね

大体、サイト圧縮とか人間じゃそこまで対して変わらんし、気付けばページ測定にGoogleツール使ってるし

なんでこんな事に気付かなかったんだろう

2017-01-15

画期的()ソリューション セキュリティフォントへの期待

自治体から情報漏洩は、僕らの大切な情報漏れることにつながる。総務省の人が言うように、「自治体セキュリティー強化は待ったなし」とはそのとおりだが、ではどうやって?
どうせどんなにセキュリティーウォールを高くしたって、横浜市役所で見られたように職員の手順ミスでの情報漏洩だったり、佐賀県公立学校情報Wi-Fiから故意に盗まれたり、絶対に、情報漏洩は防ぐことはできない。
ではどうすれば良いのか。発想の大転換。
2月に会社を立ち上げるが、「情報漏洩しても大丈夫。」そう、情報漏れた瞬間に、その漏れ情報ホワイトアウト化(蒸発)すれば良いだけの話。その特許技術を世の中に広めたいと思っています。
夏頃から本格化させようと思ったけど、情勢は思った以上に焦眉の急。急ぎます!!あなたの大切な情報を守るために。

2016-12-12

著作権関連であったら嬉しい、こんな技術

Welq問題ウェブ著作権関連が盛り上がってるので、IT素人が考える欲しい技術を書いてみた。技術に詳しい人から見るとどうなんだろ?難しいかな?

無断転載されるたびに自動著作権者お金が入る仕組み

  映像方面だとYoutubeが似たようなことをやってたっけ?

  できれば掲載した瞬間から料金が発生し、掲載期間が長いほど上乗せされていくシステムがいい

  (訪問者が多い新着期間だけ荒稼ぎして怒られたら削除するだけのアフィサイトいから)

ウェブ画像を表示するとGoogleあたりが勝手画像検索して著作権者情報を一緒に強制表示してくれる

  たとえば、あらかじめGoogleとかに著作権者情報登録しておく。

  よそのサイト無断転載されて、掲載されてる画像ファイル名や含有データが変更されてても

  登録情報から元の著作権者情報を呼び出してマウスオーバーとかで表示してくれる。

  Googleクローラーをはじいてるサイトhttpsサイトとかだっけ?)だと効果ないのかも。

  TumblrPinterestFacebookTwitterRTじゃないツイート)など、違法に共有される可能性が高いサービスには特に欲しい機能

  これらのサービス画像転載すると元ファイル情報著作権者名とかサイトURL)が画像の下部あたりに表示される。


いずれにしても多分サーバー単位管理しなきゃならないから難しいのかな。

自分サイトツイッター等にアップされた場合だけ除外して、他サイト転載されたら料金が発生したり情報強制表示になる、というのが理想なんだけど。

ただ公式サイト提供した画像でも別の販促サイトに使われたりするし、電子書籍になったりとか考えると現実的じゃないのかね……。

スキャンされたりスクショ取られたりテレビ画面を撮影したりした無断転載であっても、現在技術であれば「画像Aと無断転載画像Bは同じ画像」だと自動認識できるらしいよね

Youtubeとかでテレビ番組が消されるのに使われてる技術とか)

画像の一部だけ切り取ったり反転・色変更等を行っても元画像として認識する技術もあるとはどっかで読んだ。

いち著作権者としては、画像拡散自体を止めたいわけじゃないんだよね。宣伝になる場合があるのはその通りだし。

問題は、多くの場合著作権者作品情報と切り離されて画像けが使われてしまうのと、アダルト系や2ちゃんまとめ、詐欺など違法だったり印象の悪いサイトで使われること。

そして、どれだけ拡散されて宣伝になったとしても、実際に宣伝効果がどれだけあったのか計測する方法がないのでビジネスに活かせない。

なんとかならないじゃろか。

2016-06-29

anond:20160629130615

先輩、ありがとうございます

入門書ざっと読んでみます

それ以外は僕はその都度ぐぐることにしま


簡単クローラー作って完成させたいです!

2016-04-30

[]番外編2 お嬢マイスター縦ロールさん

 サバイバル部の同好会への格下げを阻止するため、縦ロールのお嬢様生徒会本部に乗り込んだ。

 道中、ポニーテールお嬢様と合流する。

 生徒会室に待ち受けていたのはディーゼル排気音に聞こえた生徒会三人衆。すなわち、

「リフトの書記!」

高車会計!」

「そして、ユニックの副会長!!」

 乗り物ごと待ちかまえていた三人に、お嬢様は肩をすくめた。

自己紹介ご苦労様ですわ。でも、きちんとフォークリフトや高所作業車と言わないと一部でしか通用しませんわ」

「おだまり!!」

ひだまり」スヤァ

 膝でまどろみはじめたポニーテールお嬢様あやしながら、

「あと、ユニックはインシュロックさんと同じく商h」

「そのようなお話をしにいらっしゃったの?」と副会長

 重量級の作業機械を前にしても、つとめて優雅に縦ロールのお嬢様かぶりを振った。

「いいえ。でも、ここでは貴方たちの乗り物にそぐいませんから

 さわりがなければ、それぞれわたくしの指定した場所に来ていただきたいですわ」

姑息手段を弄しても、結果は変わりありませんが……いいでしょう。

 あえて受けて立つことで格の違いを見せつけてさしあげます!」

 書記フォークリフト砂場で待ちかまえる縦ロールお嬢様に突進した直後、思いっきスタックした。

フォークリフトの接地圧は意外と高いのですわ。

 十分に転圧していない地面での走行は要注意ですわ。おーほっほっほ」

 会計の高所作業車は体育館への立ち入りを管理人に断られた。

「なぜです!ちゃんと入構申請はだしてあるはずです!!」

「すまんのう。垂直に伸び縮みするタイプの高所作業車だと思っておったもんで

 ブームタイプちょっと……」

あらあら段取り不足ですわね。おーほっほっほ」

 副会長のユニックはコンクリート敷きのピロティに進入して先生に怒られた。

「入るときはベニヤとブルーシート養生しなさい!

 さもなくば白タイヤ仕様にしなさい!!

 黒タイヤじゃコンクリートに跡が残るでしょう。消えるまでお掃除よ!!」

副会長「ひーん」

ブルーシートがなければ絨毯を敷けばよろしくてよ。おーほっほっほ」

「これで残すは生徒会長のみですわね」

「壮絶な戦いだった」

 ポニーテールお嬢様述懐した。

貴方、ずっと生徒会室のミニクローラークレーンに目を輝かせていただけでなくって?」

「あれはカッコいい。履帯蜘蛛足の組み合わせがまるでSF

「そこは同意しますわ」

 生徒会長室のドアが内側から開いた。ボーイッシュで浮き名をはせた生徒会長アフロ+螺髪)が飛び出してくる。

「その話、まぜてもらおうか!!」

お断りですわ!!」

「つれない!?ならば、自慢の100トンクレーンで吊ってやる。増田だけに!!!

「お待ちなさいっ!!戦う前にひとつ言っておくことがありますわ。

 わたくしたちお嬢サバイバル部の正式名称お嬢様DIY部のような気がしていましたけど、

 別にそんなことはありませんでしたわ!

 生徒会長アフロ+螺髪)も言い返す。

「私もひとつ言っておくことがある。殴り込みを掛けてきたお嬢サバイバル部員は君たちで三組目だ!

 もう勘弁してくれ!!」

「ならば格下げ撤回するヨロシ(すでに部員って言っているし)」

 ポニテ提案生徒会長アフロ+螺髪)は身震いのように首を振り、クレーンの操縦室に飛び乗った。

「いいや、仏の顔も三度目の正直だ。

 まずは私がこの10トンクレーン100トンクレーンを組み立てるのを見守っているがいいっ!!!

 うぃいいいいいいいいい……

 青ランプがくるくるくる。

「そんなの待てと言われて待っているお間抜けさんはいませんわーーっ!!!

 二重反転スクリューアタック

 粘性の高いスラリー干渉しないように同調して回転するスクリュー同士の働きで搬送されるっ!!

 生徒会長は錐揉みしながら美しく上衣の破片を待ち散らし、クレーンフロントスタイリッシュポーズで仰向けに倒れた。

「君も重機やらないか?」ガクッ

「これにて革命完了ですわ」

革命をするお嬢様とはなんであるのか。それは誰も知らない。めでたし…めでたし…たし」

本編1話

http://anond.hatelabo.jp/20160407225815

実は前回

http://anond.hatelabo.jp/20160413065013

2016-04-21

はてなブログPro互助会パックにしたけど

ブログ更新しても、だれも見に来ないんだけど、スターブクマも付かない。

本当に誰からもどこからアクセスが来ない、

クローラーすら来ない、

そりゃー互助会費払っていてアクセス数が0だもんな、そりゃー怒るわ。

2016-04-16

http://anond.hatelabo.jp/20160416172547

SEOSEO. グーグル検索で上位に来るには、クローラーに注目されることが1つの指標でしたからね。

まだ、クローラーには機械学習機能が付加されていないのですか。

人工知能世界みたい...。

増田SPAMクリックする奴…

ほとんどの増田は、SPAM投稿のURLをクリックしてみることは無い。

から無意味なのになんで投稿し続けるんだよ?

と疑問に思っていたんだ。

でも、この世界にはSPAMSPAMと分からクリックしまくる奴がいた。

検索エンジンクローラーだ。彼らは意味も考えずに、闇雲にリンククリックしまくる。

ボットSPAM拡散し、ボットSPAM巡回してゆく。

そのうち、人間の居場所は無くなってしまうかもしれない。

2014-12-31

1年の締めとして一人ハッカソンした

去年の今頃は「今年こそはすごいWebサービス作るぞ!!!!!!!!!!!」って意気込んでたのに

なんかもう今日が最終日。

ということでこの12月から何か作ろうと考えていて、丁度年末からということで作った。


Amazon購入金額分析

前にAmazonの購入金額合計を出すブックマークレット流行ったけど、それとほぼ同じ。

Amazonの今までの合計金額と、書籍とかPCとかカテゴリごとの合計金額出してグラフにする。

適当Twitter投稿して終わり。


年末だしTwitterで「2014年Kindle購入金額内訳は...でした」とか投稿すれば

みんなつられてアクセスするはず!宣伝しなくても勝手に大ブーム間違いなし!!!!!!!!

最終日に目標達成大勝利!!!!!!!!!


って思ってたけど

投稿してもだれもアクセスしてくれない。待っても待ってもアクセス0。

e?嘘でしょ???って思ったら

EC2セキュリティグループの設定変更忘れてた。

よーし今度こそアクセス過多間違いなし!!!!!


のはずだったけど今度はrobots.txt見に来るクソbotしかアクセスしてくれない。

虚しさ半端ない

というかTwitterURLつぶやくと即効でどこぞやのクローラー巡回してくるんですね。


構成自体クライアントサーバサイド共にjsEC2上でnode.js

D3.jsグラフ画像svgからどうにかしてpngにしないとTwitter投稿出来ないのが微妙に面倒だった

投稿時にクライアント側でbase64canvaspngにしても良かったけど

結局サーバサイドのphantomjsやらせた。

商品カテゴリ取得するためにはProduct Advertising API使うしかなくて

コレが毎秒1商品しか取得できない厳しい制限付き。

重複なしで600商品購入してたらなら10分かかる。

redis上にキャッシュしておいたりwebsocket適当に進捗伝えたりした。


今回得た経験値としては


あたり。


今年は残念ながら目標不達成だったけど、いい最終日の過ごし方になったと思う。

お疲れ様でした。

2014-12-24

イブクリスマスも予定のない俺とみんなのためのエロサイトを作った

作ったサイト

エロ動画を色々なところから収集するサイトです。

skrsvideo

http://skrsv.info/

サーバー選び

今回プログラミング言語Rubyを選択したため、基本的にはVPSクラウド的なサーバーLinuxが動作する環境を探しました。

エロサイト運営するにあたって問題になるのがサーバー選びです。

基本的日本レンタルサーバーではアダルトサイト運用を禁止しています

普段使っているさくらVPSが利用できず、AWSもなんだかグレーな感じ(東京リージョン以外なら・・・?)

そんなわけで探し、GMOグループWebkeepersを使いました。

Webkeepersのサーバー海外にあるらしいです。

質問アダルトサイト運用はできますか?

http://faq.webk.net/faq/index.php?qc=1&qc_sub=4&id=99

使っても良いよ〜というお墨付き

そして価格も手頃だったためここに決定。

システム

DBMariaDB
WebサーバNginx
フレームワークRuby on Rails

MariaDBを選んだ理由はなんとなく、MySQLとの違いはほぼありません。利用するGEMmysql2でいけます

NginxWebサーバで、ページキャッシュもしています

ちなみにJavaScriptは使わずすべてCSSで作る方針しました。

スマホPC対応のためにMedia Queryでレスポンシブにしています

Webの流れ

Nginx

unicorn

Ruby on Rails

MariaDB

という流れです

使っているGEM

gem 'mysql2'

gem 'rails_config'

gem 'kaminari'

gem 'haml-rails'

gem 'sass-rails'

gem 'nokogiri'

gem 'unicorn'

フロントhamlsassで、難しいことはしていないのでcompassはいれませんでした。

あとはデバッグ用にrails_config、pry系が入っています

クローリングスクレイピングでnokogiriを使います

クローラー

skrsvideoでは動画URLを取得するためにクローラーもどきスケジューリングして収集しています

スケジューリングにはcrontabを使用しています

crontabでRakeタスクを定期的に叩きます

コマンドはこんな感じ

RAILS_ENV=production bundle exec rake item:search


Rakeタスクはnokogiriでxvideosへのリンクを集めています

doc = Nokogiri::XML( open(URI.parse(url)).read )

urls = []

doc.css('a').each do |link|

 urls.push link[:href] if link[:href] =~ /xvideos.com\/video(\d+)/

end

Nokogiriのスクレイピングでaタグリンクを取得し、URLxvideosのものかチェックして保存って感じです。

動画を探し終えるとaタグからランダムピックアップし次のページに進んでいきます

動画が見つかったページはドメインDBに記録して、しばらくしたら再びクローリングをするようにし、収集効率化。

サイト機能

(45 min)←コレの安心感は異常wwwwww

http://blog.livedoor.jp/dennououjo/archives/39873075.html

これを思い出して、動画時間を表示するようにしました。

30分以上の表示はちょっと頑張ったところ

http://skrsv.info/30_min_more


AV女優タグが表示されるようになっています

これはタイトル文字列から部分一致で引っかかったものを表示しています

AV女優名前を表示するためにWikipediaからとってきたら、ちょっと膨大な数になってしまったため断念。

どんだけ女優いるんだって感じですね。

DMMランキングに載っていた方だけをとりあえず入れています

タグも同様にDMMから

おわりに

1日でつくろうと思っていたら思った以上にサーバーが見つからないで、サーバー選びに1日かかってしまいました。

あとはFC2とか対応できたらいいなーと思います

2014-12-04

人工知能人間の職を奪うについて

人工知能人間の職を奪うについて」と日記をはじめると非常にSF的ではあるんだが、思考実験として一つやってみる。

今回は「blog記事を書く人工知能」。

実を言うとこんな人工知能、すでにある。適当なところからコピペして自分blog記事転載するbotなんて、ちょっとプログラムをかじればすぐ作れる。

そしてこれはちょっと本腰を入れて研究すれば、すぐにかなり高性能になるだろう。

「どんなふうな記事がより注目(=ブックマークとかアクセスとか)を集められるか?」というのは評価関数を作るのがとても簡単なので、ベースとなるデータの巨大さと機械学習で順調に成長させられる。記事のまるパクリ問題も、何も真っ正直に「人工知能として本当に文脈理解して人間的な意味記事を書く」必要なんてない。

http://graphics.cs.cmu.edu/projects/scene-completion/scene-completion.pdf

この論文みたいなアプローチ記事を一つの画像だと見立てれば部分を差し替えることは可能だろうし、語尾や語彙の置きかけは、それこそ巨大置換でどうとでもなる。

人間が日ごろ、ほう、ふむふむなんて巡回できるblogの数なんてたかが知れているし、機械クロールで回収できる記事の数は莫大だ。年末年始記事やどこそこの店に行って何々がうまかったなんて記事は毎年のようにループしている(学習ネタとして最適だ)。

この種の(人工知能と呼べるほどに高度になった)botはそのべらぼうな処理能力にあかせて、アホみたいな数のサイト運営できる。登校時間バナーの位置やサイトデザインコピー文章リアルタイム評価関数ぶんぶん回すbot阿呆みたいな速度で自己進化できる。もちろんプロバイダやらが何らかの対処をする可能性もゼロではないけれど、しかしそれもほとんど意味がないだろう。回線の向こう側から規制する根拠に乏しい。もちろんコピペもととなった記事を書いた人間からすればパクリであり著作権違反だが、それを証明するのは手間だし、照明をあきらめるほど飽和攻撃を行う処理速度がbotにはある。また、人工知能的な記事合成、変換、結論変更、文章アレンジは、しばらくすればパクリパクリだと証明するのさえ難しくしてしまうだろう。何せblog記事というのは画像と比べて10%とか5%以下の情報量しかないのだ。

まあ、とにかく、こういうbotはすぐ開発できるだろう。現在技術でもほとんど可能だし、数年以内には実用化できる。

で本題なのだが、こういうbotができたらどうなるか? そりゃ、投入するでしょう。ちょっぴり初期投資をしてあとは寝てるだけで、阿呆みたいな数のアフィサイト運営できるようになる。なんらかのステマサイトも似たような手法運営できるようになる。ちょっと技術ネオニート生活! 投入されないわけがない。

そしてひとたび投入されれば、それは加速度的に高性能になっていくだろう。機械学習の結果出力っていうのはだいたいサンプルにする学習母体データの大きさや質に左右される。Webに解き放たれたクローラーはありとあらゆる泡沫Blogまで咀嚼を始めるので、その出力の制度はどんどん上がっていくだろう。

PVを金に換えるビジネスというのは一時的に大好景気になって、次の瞬間に価格破壊されるだろう。人件費が限りなくゼロに近づいてゆき過当競争になるからだ。

その世界では「人間blog記事を書く」という行為価値が果てしなく低くなるだろう。そこでははてなスター獲得競争の相手がbotになってしまうからだ。相手はたしか人間よりも記事を書く技術が低いかもしれないが、無尽蔵の体力を持ってるし、blog記事なんてそもそも10本書いて1つが注目集めればそれでいいような世界なのだ。1万本書いて9999本はずれでも構わないやつが出てきたら、体力勝負で勝てやしない。

この状況が長引けば、アフィリエイトというビジネスモデルのもの破壊されるだろう。いやそもそも、アマチュアが公開の場所記事を書くという文化のもの破壊される可能性もある。

Web世界は会員制のFacebookGoogle+みたいなもので分断され、今度はその内側から個人の記事ビッグデータにぬいていくBot蔓延するだろう。

こういうBotは廉価なサーバーマシンで動かすことができる。実際作ってみないとはっきりとは言えないが、それこそ数百体動かせる可能性もある。性能が十分に周知されれば、「日本語Blog記事を書く人」よりも「日本語コピー合成記事作成するBot」のほうが多くなることは、けっしてありえない状況ではない。

事ここに至って、人工知能は「あるジャンルの職を奪う」ことに成功する。奪われるのはアフィリエイト暮らしていた人間Blog書きだけではない。それを端緒に広報生業にしている多くの人も職を奪われる可能性がある。状況はおそらく大混乱にちかくなるので、今の時点では、この種のムーブメントにおいて電通博報堂のような広告代理店が大きく成長する可能性もあるし、致命的な打撃を受ける可能性もある。成長するにした所で、今のような体育会系的営業の会社で居続けることはできないだろう。開発や分析理系部署が今の10倍以上の大きさになるだろう。グループインタビューなんかやるよりも、匿名掲示板ログから消費行動の傾向を出したほうがよほど精度が高い企画が作れてしまう。

人間の職を奪う、というのはこういう光景雇用から減少を表現した言葉であって、実際に起きることは雇用の減少だけではない。文化や消費行動の破壊ともいえる変化だ。

まあでも俺はだから人工知能研究が怖いとか規制すべきとは思ってないんだけどね。いいぞもっとやれって思う。

2014-10-26

とあるサイトの構築

rssフィードパースしてスマホ用のhtmlに展開してs3にpushするスクリプトを書いて

heroku にあげて heroic scheduler でdailyで動かすものをつくってみた

スクレイピングをするところまでやりたいけど、もう少し時間かかるか、、

rubyによるクローラー開発技法読みながら勉強しよう

http://sp.eropop.net

2014-09-16

スクレイピングサイト作成

前に一度作成したエロサービスサイトリニューアルしてみた。

http://kawasaki.soapjou.com

ソープ嬢のスクレイピングサイト

前回の反省を踏まえて少し見やすくできたと思う。

前回の反省

 広告クリック率考えるとPCの方がおまけになってしまうかもしれない。

 詳細ページに回遊率を上げる仕組みが必要、逆にTOPページとかはアクセスないしどうでもいいっぽい。

デザイン

もうあきらめた。

Bootstrap使っても自分では無理なのでフリーテンプレートを使用。

クローラー

「simple_html_dom.php」最高だと思う。

Librahack事件を忘れないように相手のサーバーを思いやる設定(時間と頻度)にする

また、画像バイナリ比較をして更新された画像のみを取得。

サーバー

無修正サイトなど国内法に触れるもの以外のアダルトサイトGMO一択だと思う。

安いしサポート充実してます

ドメイン

お名前.com 安いし代行サービスがタダ(重要

たまにエロサイトWhoisダダ漏れの人いるよね。怖いね

アフィリエイト(予定)

前回はDTIを使用していた。

コレは動画の紹介とかやる気のある人以外効率よくないと思う。

前回は誰にも買われなかった。放置サイトPPCがよいのかな。

忍者、i-mobileなどの大手アダルトPPCを予定

おわり

Webデザインには

「はじめにAdobeありき。」

である

全てのサイト合わせて月5000円以上儲かったら(道のり遠い)買ってみる。

スクレイピングサイト作成

前に一度作成したエロサービスサイトリニューアルしてみた。

http://soapjou.com

ソープ嬢のスクレイピングサイト

前回の反省を踏まえて少し見やすくできたと思う。

前回の反省

広告クリック率考えるとPCの方がおまけになってしまうかもしれない。

詳細ページに回遊率を上げる仕組みを作って、逆にTOPページとかアクセスないしどうでもいいっぽい。


削除してしまった為再登録します。

Rails3 とTwitter Bootstrapで、オシャレなエロサイトをつくってみました。

http://anond.hatelabo.jp/20120708161051

に感化されてサイト作ってみた

bootstrap使ってもカッコよくできないよ?

プログラマー向けじゃないの?

http://searchjou.com

デザイナーって好きなサイト作れていいよなー。

デザイン

bootstrap3 の公式サイトを見ながら

CSS,Components,Javascriptタグにあるサンプルを全部作ってみた

デザインわからん。一度諦めた。

クローラー

一番経験のあるPHPを選択。

最初正規表現でガリガリ書いていたのだが

まりの面倒臭さに一度諦めた。

その後色々調べたら「simple_html_dom.php」の存在を知る。

スクレイピング作業が一瞬にして終わった。

サーバー

Root欲しいのでVPSを探す。

GMOアダルトOKっぽい、安いので決定。

postfix + dovecotメールサーバー構築

メールの設定がどうしてもできない。

仕事で何度も設定しているのに意味不明

エラーも出ていない。

一度諦めた。

しかし、サーバー代払ったので再度トライ

info@xxxx.com

メールアドレス作成していたのだが

システムエイリアスで「info」を使用していたため

メール転送出来ずに受信できなかったもよう。

危ない名前は使わないのは基本だよね。

/etc/aliases は確認しましょう。

データベース

Mysqlを使用、一応クエリキャッシュ設定

MyIsamだとインデックスに容量制限があるのでInnoDB使用

表示

php + Smarty

キャッシュSmarty実装

プログラマーからデザイン出来ないんじゃなくて

自分センスがないのが原因な事が判明。

出来あがったサイト

川崎ソープ嬢を検索 - サーチ嬢

http://searchjou.com

数1000件のデータなのでキャッシュインデックスいらなかったかも。

プログラマデザインやるのと

デザイナープログラムやるのって後者の方が敷居は高いとは思う。

でもプログラム勉強できるけどデザインってセンスがなきゃどうしようもない。

おわり

もう少しデザイン頑張ってみる。

デザインの教本読んでみると

最初に「Adobe」ありき。で話が始まるけど敷居高くない?

Adobeクラウドの月5000円でも高いよー。

2014-09-02

http://anond.hatelabo.jp/20140902160914

ちょっと」複雑な。具体的にはクローラーやで。

bashメインで書いてるんだけど、jsonだったりURL文字列だったりの複号/符号化はbash単体でやるにはちと辛い。

そんな時にスクリプト内でPHPを使うとあら素敵になるケースは結構あるんや。

クローラ全体をPHPで書くやつもいるけどな)

2014-08-02

「ご遠慮ください」「お控えください」は禁止だろうか?

クローラーをこういう文言規制?してたんだけど 問題が起こらないように配慮すれば許されるかな?

ダメかな?

アーカイブ ヘルプ
ログイン ユーザー登録
ようこそ ゲスト さん