はてなキーワード: rssとは
Amazon.co.jp: 情報を捨てる技術―あふれる情報のどれをどう捨てるか: 本: 諏訪 邦夫
本の内容は忘れたけど、とにかく「捨てる」ことを考えるべきだと思うんだ。あと、フィルタリング。いらなくなったRSSやメルマガは全て購読解除。そういう意味で、「すぐに飽きる才能」があれば便利。余分な情報の流入をかなり防げる。
> どんな形式(PDF, ワード, 一太郎, HTML, Flash)にでも変換できるような、中間言語があるといいのかな。TeXとか。
実はこういう方向に思考が行くのは正当な流れで、その延長上に"XMLに対する期待"ってものがあったりする。XMLって、中身と見た目を完全に分けて、クライアント側で、そのクライアントに適したようにレンダリングしてよ、っていうのが目的のひとつだから、まさにここでいう中間コード。
ただし、中間コードとして何でもできるXMLみたいな規格は複雑すぎて、簡単な用途に使うのには流行らなかった。まぁ、いくつか流行ったものもあるけどね。RSSとか。
そこでどうなったかというと、"中身と見た目の分離"というところでぴんと来た人もいるだろうけど、HTML+CSS。適当に簡単で、しかも中身と見た目を分離できる。
というわけで、みんな、なんだか同じところをぐるぐる回ってるんじゃないかなぁ・・・という話でした。
最近perlの勉強してて、naoyaのはてなダイアリー - Web::ScraperでWeb::Scraperを知り、試しにはてブのAPIを真似してニフティクリップのコメントを吐くJSONを作った。
#!/usr/local/bin/perl -T # # use strict; use warnings; use URI; use Web::Scraper; use JSON::XS; use CGI; use Encode; my $q = new CGI; print $q->header( -type=>'text/plain', -charset=>'UTF-8'); my $path_info = $q->path_info; my $path = $path_info =~ m{^/?(nobracket/)?(http\w?)://?(.*)$}xms ? $2.'://'.$3 : undef ; exit if ! $path; my $is_nobracket = 'true' if $1; if ($q->query_string) { my $query_string = $q->query_string; $query_string =~ s/;/&/g; $path = $path.'?'.$query_string } $path =~ s/%23/#/; $path =~ s/([^\w ])/'%' . unpack('H2', $1)/eg; $path =~ tr/ /+/; my $entry_url = "http://clip.nifty.com/entry/?url=" . $path; my $bookmarks = scraper { process 'h4>a', 'user' => 'TEXT'; process 'li.dateAndTime', 'timestamp' => 'TEXT'; process 'a.tagtag', 'tags[]' => sub { my $text = $_->as_text or return; my $left = decode_utf8('??~P'); my $right = decode_utf8('??~Q'); return $text =~ /$left (.*?) $right/xms; }; process 'p.comment', 'comment' => 'TEXT'; result 'user', 'timestamp', 'tags', 'comment'; }; my $niftyclip_entry_info = scraper { process 'div.clipTitle>h3>a', 'title' => 'TEXT'; process 'div.clipTitle>p.url>a', 'url' => '@href'; process 'div.comments>div.commentsDetails', 'bookmarks[]' => $bookmarks; result 'title','url','bookmarks'; }; my $niftyclip = scraper { process 'div#content', 'niftyclip_entry' => $niftyclip_entry_info; result 'niftyclip_entry'; }->scrape(URI->new($entry_url)); exit if ! ($niftyclip->{'url'}); $niftyclip->{'entry_url'} = $entry_url; $niftyclip->{'count'} = @{$niftyclip->{'bookmarks'}}; my $json = JSON::XS->new->utf8->encode($niftyclip); $json = '('. $json. ')' if ! $is_nobracket; print $json;
取得方法は
http://monm.on.coocan.jp/niftyclip/json/entry/<取得したいURL>
ってすればいい。「#」は「%23」にエスケープしないとダメ。
作りながら「取得したいURLをURLエンコードするのは面倒だな」って思い、はてブのAPIみたいにpath_infoでアクセスできるようにしたわけだけど、その取得したいURLにquery_stringが付いてた場合にどうやってやって良いかわからず結構悩んだ。
結局、path_info+'&'+query_stringってやることで無理やり作ったけど、普通どうやるもんなんだろ?cpanに何か良いモジュールがあったりするのかな。
それと、はてブに合わせて出力の際に()を付けるようにしたけど、これだとYahoo!Pipesで使えなかったから、
http://monm.on.coocan.jp/niftyclip/json/entry/nobracket/<取得したいURL>
みたいに「nobracket」付きでアクセスした場合には()を付けないようにした。
コレ使うとニフティクリップとlivedoor クリプのコメント取ってくるAPIみたいなのが作れる。
RSSで取得する場合は
http://pipes.yahoo.com/pipes/pipe.run?_id=zECBJ_VY3BGtBw6B8ivLAg&_render=rss&URL=<URLエンコードしたURL>
で取得できるし、jsonで取得する場合は
http://pipes.yahoo.com/pipes/pipe.run?_id=zECBJ_VY3BGtBw6B8ivLAg&_render=json&URL=<URLエンコードしたURL>
ってなる。
とりあえずサクッと作ってみたけど、わざわざページからJSON作ってるからちょっと重い。
その頃にはJSON吐いてくれるようになるんじゃないかなと期待はしてるけど。
参考URL:
http://anond.hatelabo.jp/20070812215709
最新の25件のエントリのみ前文表示しています。
RSSをダウンロードしているので、それ以前のものは表示できません。
お待たせしました。
うちのサイト http://www.usotsuki.com/ にブックマークをお願いします。
なぜなら自分の作ったものがみんなにブックマークされるのは最高に興奮します。
もちろんエレクトはしないけど。
追加機能ですが、
・一覧表示対応
です。RSSから取得しているので最新の25件を表示しています。
いやっっほぅぅぅ!
と喜び勇んでアクセスしたら
http://anond.hatelabo.jp/20070815132528
http://anond.hatelabo.jp/20070815120004
http://anond.hatelabo.jp/20070814234703
http://anond.hatelabo.jp/20070815114852
等々、一覧表示されててorz
そうだよねそうだよね、「一覧」だもんね。
・・・記事のタイトルだけじゃなくて、本文も含めて一覧を読みたかったな。
http://anond.hatelabo.jp/20070812215709
機能追加を行いました。
追加機能ですが、
・一覧表示対応
です。RSSから取得しているので最新の25件を表示しています。
http://www.usotsuki.com/list.html
それでは。
del.icio.usでもソーシャルブックマークしているのを見つけた。
しかし、はてぶのほうでも続けているようだ。
なんでだろうと考えてみた。
ブックマークしているエントリから推測するに、RSSを購読するユーザを引っ掛けるためだろうか?
謎である。
1、面白いエントリを見つけた。
2、とりあえずはてブに登録した。
あれ?このサイトって前にもけっこうブックマークしてなかったっけ?
4、これって自分の興味に合致したブログだってことだろうから、
RSSリーダに登録したほうがいいかなあ。
5、本当に「頻繁にブックマーク」してるサイトなのか疑問に思ったので、
http://b.hatena.ne.jp/自分のアカウント名/?url=http%3A%2F%2Fanond.hatelabo.jp%2F
とかで、ブクマをそのサイトのみに絞り込んで表示して、本当に「頻繁にブックマーク」してるサイトなのか、チェックだ!
6、頻繁にブックマークしているようなので、サイトをRSSリーダに登録することにしました。
7、なんと、RSSがありません
8、アンテナに登録しました
***
先ほど私がやっていた作業を文章化してみた。
もっとこう、効率化できないものかしら。
「ブックマークの追加」画面で「このサイトへは過去に○○回ブックマークしています」って出ないかしら。
RSSとアンテナって結局「ウェブサイトをヲチする」ってことで同一の行為なんだから
http://blogwatcher.pi.titech.ac.jp/nandemorss/
あたりの機能を加味した上で、さっさと同一のサービスになってくれないかしら。
***
つれづれ思った。
みんなこういうことはやってないのかしら。
「ブクマするだけ」から「定期巡回先に加える」という格上げを、
皆はどうやってるんだろうかと疑問に思った。
ニコニコ動画でアイマスMADの良作を眺めるのが好きだけど追っかけられないときもあるって人はhttp://nicoboom.org/search?q=%E3%82%A2%E3%82%A4%E3%83%89%E3%83%AB%E3%83%9E%E3%82%B9%E3%82%BF%E3%83%BC+%7C+%E3%82%A2%E3%82%A4%E3%83%9E%E3%82%B9+%7C+idol+%7C+im%40s&ob=mv&oo=d&limit=100のフィードをRSSリーダーに登録すると幸せになれると思う。
ここ1年ほどは、はてブの新着を追いかけるだけで満足してRSSリーダーを全く利用していなかったけど、今日ばかりはRSSのありがたみを実感した。
はてなRSSはブクマ数が出るのとブクマしやすいのが便利。livedoor Readerは軽快なのとデザインが好み。
さてどっちメインに使おうか…。
同じダイアリーから何度も来てるんなら、
そのIDの人のアンテナとかRSSに登録されてる可能性もある。
アンテナ登録数は
http://a.hatena.ne.jp/include?
の「?」のあとに自分のダイアリーのアドレスを入れればわかるよ。
あとRSS登録数(つっても、はてなRSSの場合だけだけど)は
流石は無断リンク禁止アイドル、おれたちにできない事を平然とやってのけるッ! そこに痺れる!憧れるゥ!
リンク先の管理者が禁止している行為をしたユーザーにアクセス停止期間を設けて欲しい。
相手をひどく罵る様なタグを設けるのを禁止にしてくれないと困ります。
利用規約の改正を求めます。ページ単体へのリンクは自由ではなく、たいていのウェブサイトでは禁止されています。何でページ単体への無断リンクを推奨するんですか。最悪ですね。
TOP以外へリンクした場合、管理者に自動通知するなどの対処をしてもらわないと困りますね。
無断リンク禁止ぐらいで騒ぎ立てるかのように無断リンクしないでほしいですね。騒ぐぐらいだったらこんなサービス廃止してください。
はてなブックマークなんてhttp://alink.uic.to/と同じ使い方をすべきCGIです。自由なリンクなんてこれ以上認めるつもりはありませんから、私は。(却下したら許しません)
RSS対応、ページ単体への自由リンク、リンク先の巡回、すべて却下したい。
システムの廃止を希望します。望まないリンクを推奨すること自体間違っています。
ページ単体リンクのシステム廃止希望。自由なリンクなんてネットじゃありえない!
リンクは自由と言いますが、もしその自由なリンクで荒らしや不正アクセスなどの被害にあったら貴社はどう責任を取るおつもりですか。説明していただけないでしょうか。
ついでに言いますけれども、自由にリンクを貼られたページをすべて安全とみなしているようですが何を根拠にそうみなしているのか説明してください。
つまり、私が言いたいことは貴社の当該サービスが、Webサイトを場合によっては危険にさらしているということです。
サービスはそもそも自動登録リンク集と同じように使うのが本来の利用方法なのではないだろうか。
無断リンクが原因で荒らしや不正アクセスの被害を受ける事も十分あり得るのにそのトラブルが起こる事を承知で運営しているのか。
Webサイトの利用規約に会社とユーザーが集団で、いわば組織ぐるみで破るのはいかがな物か
貴社サービスを拠点にネットストーキングしてくる人が居ますのでそのようなユーザーを見つけた際は強制退会処置をしてください。
読まない。
2chができた1999年頃、丁度個人ニュースサイトや個人日記サイトも盛り上がり始めたころだった。
「個人ニュースサイトなんて不要だ」「すぐいらなくなる」なんて声も一部にあったけれど、
それどころか年を追うごとにますます増えていく一方だ
。
昔はごく一部の個人ニュースサイトだけが月数万ヒットー10数万ヒットしていて、大手と呼ばれていた。
今じゃ、月10万単位のアクセスのあるサイトが無数に存在する。
単純に市場が大きくなったからだ。
7-8年前よりも、ずっと沢山の人がネットを見るようになった。
だから個人ニュースサイトの需要も、ますます伸びてきているんだ。
ちなみに当時はRSSという仕組みがなかったら、個人ニュースサイトの更新情報を追いかける「アンテナ」も流行した。
今は「はてなアンテナ」があり、誰でも簡単に使えるから、
昔よりも沢山の人が、より多くのニュースサイトを横断的に見ることができるようになったんだ。
え? 前置きはいいからアクセスを増やす方法を教えてくれって?
じゃあ手短に。
2 独自の切り口と、品質絶対主義
1 美しさは人を惹きつける。
だから自分のサイトのデザインは、シンプルで美しくする必要がある。
webページを見て、メニューが複雑だったり、ごちゃごちゃと小さな文字や広告が入り乱れていない?
大きければいいというものではないよ。サイズを小さくしてみたり、あるいは試しに外してしまいなよ。
かつ記事の内容に合致した商品リンクを試してみてはどうだろう。
2 どんなジャンルを扱っているの? 得意分野は何?
それがお客さんにはっきりわかる必要があるよ。
そして何より、記事の品質が全てだ。
つまらないネタ記事を数合わせの為に入れるのは絶対に止めるんだ。
自分が「これは」と思った記事だけを登録すること。
そして、見ている人にとって役に立つ、面白い情報であることを意識した記事にすること。
気の効いたコメントが思い浮かばなかったら、綺麗な画像を載せればいいんだ。
有名なニュースサイトは、いつも美しい写真をアップしているよね。
3 どんな人が管理人なの? もし本気でやるつもりなら、簡単な自己紹介ページを作っておくといいよ。
管理人の人となりがわかると、お客さんは何度も足を運びたくなるよ。
顔文字というのは、上手く使えば驚くほど人の感性に訴えることができるんだ。
2chでキタ━━━━(゜∀゜)━━━━!!などのアスキーアートが常にコピペされているのは、
それが人の心を直撃するからなんだよ。
参考サイトはこちら
http://matsucon.net/material/dic/kao_11.html
【おまけ】
アクセスを増やしたかったら、当然宣伝が必要だよね。
どうやって宣伝しようか?
まず、自分のサイトが検索エンジンに登録されているか確認すること。
自サイト名で検索してみよう、1番目に表示されたかな?
もしサイト名が無個性な名前だったら、必ずオリジナリティのある名前に変えたほうがいいよ。
検索で出るようになったら、次はリンクを貼ってもらうこと。大手ニュースサイトで記事が紹介されたり、
リンクページに載れば必ず大量のアクセスが来るよ。そのお客さんを掴むんだ。
ただ「相互リンクの依頼お断り」の所も多いから、注意してね。
Google AdWordsみたいに有料の広告を使ったことはある?
試しに使ってみたらどうだろう。自分が広告を出す立場になると、見えてくるものがあるはずだよ。
最後に、記事の更新に費やす時間は1日1時間以内にすること!!
ダラダラと長時間やっても、効率は上がらないよ。それよりちょっとデジカメ持って外に出よう。
短い時間の中で工夫しようとすると、どんどん新しいツールや仕組みを使う必要に迫られるから、
かえって自分の能力を高めることができるんだ。ショートカットキー1つ知っているかどうかだって大事だよ。
例えばプログラムを書ける人は、あなたが必死になって手動で収拾しているニュースを、
道具の使い方を覚える事が、自分の時間を増やしてくれるんだよ。
だからニュースを集める時間の他に、自分がスキルアップするための時間を毎日確保しよう。
anond:20070324154048のあと、グループ、RSS、リング、そしてアンテナ(告知見つからず)がサクラヘ移転している。
% diff resolve.old resolve.txt | grep '[<>]' | sort < 125.206.202.82: search.hatena.ne.jp. < 221.186.129.147: ring.hatena.ne.jp. < 221.186.129.148: g.hatena.ne.jp. < 221.186.146.28: a.hatena.ne.jp. < 61.196.246.68: r.hatena.ne.jp. > 221.186.129.147: search.hatena.ne.jp. > 59.106.108.73: g.hatena.ne.jp. > 59.106.108.74: a.hatena.ne.jp. > 59.106.108.75: r.hatena.ne.jp. > 59.106.108.76: ring.hatena.ne.jp.
さて、次はq、そしてよいよdだろうか。