2011-08-25

エロ動画URLからAV女優名が分かるエロサービス作ってみた

【お知らせ】2011/09/07

新しいエロWEBサービス作りました

http://d.hatena.ne.jp/uniqueweb/20110906/1315285545

独学のプログラムエロ動画検索作ってみた!でエロ動画検索サイトを作った者です

あれからエロを通して技術の更なる発展に貢献したいという思いから昼夜問わず情報収集に励んでおりました。

技術の発展に貢献するということが目的であり、決して個人的趣味熟女物の柔らかおっぱい動画を中心に収集していたなんてことはありません。

あの日もたまたま熟女物を探してたんです

尿意を催したのでトイレに行くためにパソコンの前をほんの少しの間離れていた時にたまたま自分の部屋に母親が爪きりを借りにきました。

その時、モニターには大好きな「白石さゆり」の動画が映しだされていました。

当然、モニターの電源など切るわけもなくつけっぱでトイレに行っていました。

母親は画面に映し出されていた白石さゆりをしっかりと見たでしょう!

別に思春期男の子じゃないんでエロ動画見てたのがバレたくらいなんてことはありません。

余裕です!超余裕です

でもね、トイレから帰ってきてふと画面に視線を移した時、見ちゃったんです

画面に映し出されている動画タイトル




近親相姦 マン毛ボーボーの母」




ぎゃあああああああああああああああああ!!!!111111111


違う!違う!違~う!!!

俺が好きなのは白石さゆりであって母じゃないから!

しかも、よりによってなぜ「マン毛ボーボーの母」なの?・・・

母だけでも大問題なのになぜ「マン毛ボーボー」・・・

言っておきますがそういう性癖は全くありません。

白石さゆりの柔らかおっぱいが好きなんです

近親相姦とか無理です

トイレから帰ってきた時、自分を見る母親の目が汚い物を見るような感じがしたのはこのせいなんですね。分かりました。

そっと部屋を出ていく母

呆然とする俺

時すでにお寿司・・・ww

しかし、いいんです

技術の発展には犠牲はつきものなんです

まあそんなことがありつつ新しいツールが完成しました!

サイト名:これなんてAV女優?

はい、これが新作です

というか本当はヌキネーターデータを使いまわしてます

いったいどんなサイトかというと

エロ動画収集をしてると、この動画女優最高すぎる!なんて名前なんだろう?って思うことがありませんか?

ありますよね?

そこで、エロい私は閃きました。

URLからAV女優引けたら便利じゃね?

俺って変態じゃね?じゃなくてすごくね?

と思い勢いで作ってみました。

ただ、データ件数が非常に少なかったので新たにデータを追加するためのスクレイピングが非常に大変で

やっつけぎみで作ろうとしたら想定外時間がかかってしまいました。

使い方です

検索ボックス動画URLコピペ

検索ボタンを押す

該当するデータがあれば女優名を表示し

googleイメージ検索パラメータ女優名を設定したURLリンク

ヌキネーターの検索パラメータ女優名を設定したURLリンク

それに、該当女優動画へのサムネイルつきリンクを最大5件で表示させるようにしました。

例えば

http://www.xvideos.com/video811376

検索ボックスコピペして検索してみて下さい。

URLデータデータベース存在するので該当するデータが表示されていると思います

こんな感じで気になるあの子名前とか関連動画とか分かっちゃうかもしれません。

対応動画サイトはxvideos yourfilehost megapron megavideo pornhost tube8

tokyotube 裏アゲサゲ slutload fc2 megafilex xhamster

となっています


さて、この間と同様に簡単に作り方を書いて行こうかと思います

サーバーデータベース、負荷対策など細かい設定は前回のエロ動画検索作ってみた!ときと同様です

今回は元となるデータ作成方法について少しくわしく書いてみたいと思います

データ作成方法

  1. まず某巨大サイトよりAV女優一覧のデータスクレイピング女優データを作ります。(スクレイピングについてはググるか前回の日記を読んでみて下さい。)
  2. 某Q&Aサイトなどで「このAV女優」などで検索します。
  3. 質問文中のURLを抜き出します。
  4. 解答の中にAV女優名がないか1で作ったデータで照合します。
  5. AV女優名が存在した場合3のURLAV女優名を紐付けたデータ作成します。

こんな感じの作業を色んなサイトでやります

この方法マニアック検索しても女優名が分からないような)なAV女優データを収集します。

すごくめんどくさいです

残りはヌキネーターデータを流用しています

結果表示画面のサムネイル画像の取得方法

この間はここについて説明がなかったと思うので軽く説明します。

大抵の場合動画ページにサムネイル画像URL情報が記載されていたり

動画URLの数値等とサムネイルURLが関連があったりして

そこからサムネイルURLを引っ張ってこれるのです

megafilexとかtokyotubeなんかの場合だと画像サーバーが複数に分かれていて

動画URLの数値等からではサムネイル情報が取得できません。

通常の場合
http://example.co.jp/videoimg/動画関連数値等.jpg
こんな感じで取得できたりするんですが

megafilexなどは
http://j.www.megafilex.com
http://f.www.megafilex.com
http://g.www.megafilex.com
http://h.www.megafilex.com
http://i.www.megafilex.com

みたいな感じで複数の画像サーバーがあるのでどのサーバーに該当動画サムネイル画像ファイルがあるのか分からなくなっています

上記を見るとwwwの前にアルファベットが付いています

そこから画像サーバーにはアルファベットが付くことが推測できます

aからzまでを付加したURL動画関連数値を付加しアクセスするプログラムを書きます

HTTPステータスコードを取得します。

200だった場合画像存在するのでそのURLサムネイル画像URLとして記録します。

まとめ

検索文字列URLなので負荷対策に若干不安はあるんです

とりあえずリリースしてみました。

動画URLを5万件くらい追加したんですけどまだまだデータが足りないか・・・

分かったらラッキー!くらいでこれなんてAV女優?をご利用頂ければと思います・・・

しかし、エロ系のサイトって作るの楽しいですね。

エロサイト作りだと制作意欲がわくのはなぜでしょうか?w

また何か思いついたら作ってみたいと思います

ではではまた技術の発展のためにエロ情報の収集に戻りたいと思います

エロい人やプログラマーさんデザイナーさんエログ運営者さんWEB制作会社さん

色々情報交換してくれるとありがたいです

ヌキネーターの問い合わせフォームがありますのでお気軽にお声をおかけ下さい。

それとツイッターをはじめてみたんでフォローしてくれると嬉しいです

※追記 2011/08/25 23:09

風呂入ってサイトアクセスしたら全くつながらなかったんでアクセス解析見たらえらいことになっててびびりました・・・

とりあえず、httpd.confの設定変更したので今はつながると思います

ご迷惑をおかけしました。

※追記 2011/08/26 13:46

なぜかサービスの方にブクマが沢山ついている・・・

自分的にはむしろ頑張って恥ずかしいエピソードを書いたこっちが本体で

サービスはオマケなんだ!ww

そして顔認識とかそんな技術は持ち合わせておりません(汗

そして動画データ件数をカウントしてみたら22万件くらいでした。

まだ大分精度が悪いんでちょくちょく追加していく予定です

※追記 2011/09/07

新しいエロWEBサービス作りました

http://d.hatena.ne.jp/uniqueweb/20110906/1315285545

トラックバック - http://anond.hatelabo.jp/20110825164531

記事への反応(ブックマークコメント)