2014-09-25

http://anond.hatelabo.jp/20140924214600

1. 取得したいページのURL配列を作る ["http://www.hogehoge.com/1","http://www.hogehoge.com/2"・・・]

2. URL引数とした、該当のページから取得したい情報を抜き出すプログラム関数)を書く タイトル、xvideoのURL、xvideoのIDなどなど

3. 2のプログラム最後に、抜き出した情報データベースに登録する処理を書く。この時、xvideoのidなどで登録済みか未登録かを場合分けして、登録済みの場合スキップする。

4. 1の配列に対してループを回して、2のプログラムをそれぞれのURLで実行する。

>・埋め込みタグ抽出

・埋め込みタグは取らなくていいんじゃないかな?xvideoのid差し替えるだけで、表示できると思う。

>・タイトル自動で付けたい。

これはかなり難しいと思う。そもそも、xvideoのタイトル英語だし、きちんと付けられていない。そうすると、動画の中身を読み取ることになるけれど、それはかなり難しいだろう。日本語の説明文がないから形態素解析も役に立たない。自分だったら、見た人に協力してもらって、日本語でのタイトル付けをしてもらう機能実装する。

> Rails への移行

学習コストがかなり高いから、2ヶ月位は開発止まると思う。でも、楽しいのでおすすめ

記事への反応 -

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん