「それPla」を含む日記 RSS

はてなキーワード: それPlaとは

2008-04-23

4Uの画像が美しすぎてPerlプログラム組んでみた

4Uって知ってるかい?

http://4u.straightline.jp/

世界中の美女画像を皆でシェアするソーシャルイメージブックマークサービス

とのことさ。それはほんともう美しい画像が満載で毎日見てても飽きないわけさ。

そこでローカル画像を保存しようと思い、ちょっくら実装してみた。


#!/usr/local/bin/perl -w

use strict;
use warnings;
use Web::Scraper;
use LWP::UserAgent; 
use Perl6::Say;
use MIME::Type;
use URI;
use Data::Dumper; sub p { print Data::Dumper::Dumper(@_) };

my $page = shift || 1000;
unless ( $page =~ /^\d+$/ ) {
    die 'perl 4u.pl [page as int]';
}

for my $i (1..$page) {
    
    my $url = sprintf 'http://4u.straightline.jp/?page=%s' , $i;
    
    say "request url>".$url;
    
    my $tmp = scraper {
        process 'ul.entry-list>li>div.entry-body>div.entry-photo>a', 'link[]' => '@href';
        process 'ul.entry-list>li>div.entry-footer>div.wrapper-entry-description>div.entry-description>p.entry-img-src', 'img[]' => 'TEXT';
        result 'link','img';
    }->scrape( URI->new($url) );
    
    my $links = $tmp->{link};
    my $imgs  = $tmp->{img};
    
    if ( ref $links ne 'ARRAY' ) {
        say "end program.";
        exit;
    }
    
    for my $link (@$links) {
        $link =~ m{/([^/]+)$};
        my $sesid = $1;
        
        sleep 1;
        
        my $image_url = shift @$imgs || next;
        $image_url = 'http://'.$image_url;
        
        say "get image url >".$image_url;
        
        my $ua = LWP::UserAgent->new;
        my $req = HTTP::Request->new(GET => $image_url);
        my $res = $ua->request($req);
        my $content = $res->content;
        my $content_type = $res->headers->header('content-type');
        my $ext = MIME::Type->new( type => $content_type )->subType || 'bin';
        
        my $write_path = './img/'.$sesid.'.'.$ext;
        
        if ( -f $write_path ) {
            say "file exsits end program >".$write_path;
            exit;
        }
        
        open my $FH, '>', $write_path;
        binmode $FH;
        print $FH $content;
        close $FH;
        
        say "write image >".$write_path;
    }
}

それPlaggerでで・・・」モウココウハザン!ドスッ!

貴様、うるせーんだよ。

今回俺としてはWeb::Scraper使いたかったので自力実装してみますた

使い方を試しながらだったので製作時間2時間くらいかかたお。次からはもっと短縮できそうだ。

まーがーっと書いた後に整理してないからコード自体はかなり汚ねぇのでご了承を。ふへ。

とりあえず4u.plを叩くとカレントディレクトリのimgフォルダに取得した画像を次々書き込んでいく。

ちゃんと次のページにも遷移しながらどんどんがんがん書き込んでいくのさ。

で、以前取得したことのある画像にぶつかるとそこでプログラム終了。

ちゅーかなんつってもWeb::Scraperってばスゲエよな。俺のクリオアがびんびん反応するぜ。え?クオリアだって?うっせぇ野暮なこと言うなよ。

プログラ増田のあなぐら

2007-06-14

それpla(ry

なのかは俺まったく知らないけどd:id:otsuneの人に聞けば教えてもらえるかもよ。

普通に聞くと教えてもらえないかもしれないから、すごい偉そうに「何がplaggerだ!どうせ××することできないだろ!」とか書けば、ツッコミとしてやり方を説明してくれるかもしれん。そしてその後に「ありがとうございました。優越感ゲームをいじるのに目がないotsuneさんならきっとこういうやり方に一番食いつくと思って失礼なことをしました」とか言えばかっこいい。

http://anond.hatelabo.jp/20070614203435

2007-01-28

俺は転載してもいいと思う。

「転載」と「引用」はまったく別物である。

先にことわっとくけど、俺は法律に関してはさっぱりわからんよ。

で、ニュース転載に関してなんだけど、((blogじゃなくてね))

新聞社サイトニュースなんかは、後日消されることが多い。

例えば、ざっくり1年前あたりのニュースを見てみたんだけど、

はてなブックマーク - 過去の人気エントリー

この中で、

が見れなくなってる。

cnetimpressあたりだと残ってるんだけど、一般向けの新聞社だと消されやすい印象。yahooとかもね。

そんなときに、全文転載してるblogがあると、元記事が見れて便利。

元記事が何で、どこからどこまでが元記事で、どこからがblog主の記事かがわかれば問題ないと思う。((法律上は知らないよ。)) ((Livedoor PJニュースの件はここが問題なのでは?))

見やすさからいうと、別ページになってた方がいいけど。魚拓とか使ってほしい。

otsuneさんのblogだと、リンクの横に_がついててキャッシュへのリンクになってるっぽいけど、公開してくれてないからキライ><

あれがウェブ魚拓へのリンクになってれば最高なんだけどなぁ。

あと、自動でウェブ魚拓とって、はてブの関連URLに登録してくれないかなぁ、誰か、それplaとか言いながら。

転載ほとんどコメントが一言だけ、ってのもちょっといやだけど、

それよりも、はてダ使ってて、リンクコメント一言とか、リンクだけってがひどいと思う。はてブ使えよ。

はてブの含む日記に載ってて、長いコメントがあるかなと思いながら見に行ったらリンクだけとか嫌過ぎる。

リンク先にどのくらいのコメントがあるかわかるようなの作ってくれないかなぁ、誰か、それgreとか言いながら。

しかし、著作権存在しないことをたてにしたweb上での転載が横行すれば、独自性のあるブログを作ろうという野心を持ったブロガーが減少してしまわないか不安になる。現に、2chコピペブログやここはてな匿名ダイアリーにおいても、無断転載と思われる記事が結構多いのだ。無断転載をされた側は糾弾するすべがなく、無断転載をする側は何も考えずにブログエントリニュース記事を作製できてしまうことになる。これがネット上での議論をより質の低いものにすることは、目に見えている。よりよいネットでの議論を維持し再構築するためにも、「引用」を正しく用いてくださるよう、私から皆様にご協力をお願いしたい。

「転載」と「引用」はまったく別物である。

これに関しては、元記事へのリンクがある「転載」ではなくて、自分の記事としてコピーすることに問題があるんじゃないかな。

いわゆる「パクリ」ってやつですな。「剽窃」ってのもこのことか。

少なくとも、アホ理系青年の主張〜窓野マサミ☆アホージャーナル〜:ニュース記事転載系ブログサイトを読むと憎いし苦痛だ - livedoor Blog(ブログ)で言ってる「転載」とは違うと思う。

2007-01-20

それpla

一度言ってみたかった。べつに反省はしていない。

http://anond.hatelabo.jp/20070120233456

2006-12-12

http://anond.hatelabo.jp/20061211084642

俺もぶっちゃけて。

それPlagger関係なくね?

てか特定個人の特定タグまで絞ったらもう殆ど残らないんですが。

タグ「○○」を含む新着エントリーでも十分読める。

俺からすれば、フィルタリング以前に

はてブ情報量が少なすぎて使えない、なんだが。

2006-12-07

[]悪魔の辞典

それpla

自分では何も出来ないが、取り合えずPlagger様がなんとかしてくれるという状況を表す言葉

2006-12-02

それpla

http://anond.hatelabo.jp/20061202073654

いや、しらんけど。

ともかく不完全でもなんでもいいから動くものを提示しないとちゃんと見てもらえないと思うよ。

2006-11-20

[]気晴らしに替え歌を作ろうとしたけど

これはひどいのだ 死ねばいいのだ

もん もん しなもん しなもんもん

天才会社だ しなもんもん

ここだけ10秒で作ってもう満足してしまった。

あと、

「しなえも〜〜〜〜ん!」

「どうしたの、なお太くん?どうせまたジュンヤンになんでなんで攻撃でもされたんでしょ」

「そうなんだよ!どうにかしてジュンヤンをぎゃふんと言わしてやりたいんだけどなんとかしてよ!?」

それPlaggerで出来るよ」

とかいうどうしようもない話が浮かんでしまった。疲れてるんだな。

 
アーカイブ ヘルプ
ログイン ユーザー登録
ようこそ ゲスト さん