はてなキーワード: 情報検索とは
最近、LinkedInで転職の情報収集をしていた。LinkedInに掲載されている求人広告は、Easy Applyという機能を使ってワンクリックで応募できる。
一度にかなりの数の会社に応募することができるので、どの会社にいつ応募したかあまり覚えていない。
ある日、履歴書に掲載していたメールアドレス宛に、イギリスの某社の人事マネージャーを名乗る人物から連絡がきた。
あなたは選考の結果、募集ポジションの候補に選ばれたので、ついては来月、ロンドンの某所に来られたいという内容だった。
メールにはPDFで職務の詳細を記載した書類、面接の招待状、ロンドンまでの旅行情報が添付されており、非常に信憑性が高く見えた。
職務詳細書類に記載されていた給料は高く、福利厚生がしっかりしており、魅力的なポジションに見えた。
会社のウェブサイトにアクセスすると、小規模であるがしっかりとした会社であるように見えた。
旅費は会社負担で、ロンドン到着時に払い戻す。ついては当社と提携関係にある旅行会社の職員に連絡をし、さっそく旅行の手配をしてほしいと先方から言ってきた。
そのため、指示された連絡先へ、旅行の手配を依頼する連絡を入れた。
翌日、旅行会社の職員を名乗る人物から返信があり、添付ファイルで旅行の手配準備に使用する文書を送ってきた。
その文書によれば、送金サービスを使って、旅行会社宛にデポジットを送金していただきたい、パスポートのコピー、申込書とともに送金確認書を送れば、旅行の手配をすると書いてあった。
後日、旅行会社へ送金をしようと思い、日本にある送金サービスの代理店へ行ったが、こちらの側に手続き上の情報に関する不備があり、送金することはできなかった。
帰り際にそこの職員の人に言われたのだが、その送金サービスを使った詐欺があるので、気をつけてくださいということだった。
その詐欺とは、あなたは宝くじに当たったので、ついては引き出すための前金としてかくかくしかじかの宛先に、送金サービスを使ってお金を送ってくださいというものらしい。
帰りの道すがら、自分の場合は実在する会社の転職面接に行くだけだから大丈夫だろうと思っていた。
帰宅後、LinkedInを開いて、面接に呼ばれた会社名で検索をすると、その会社で働いている人が一人も検索にヒットしなかった。
Companies Houseという、イギリスの政府が提供している企業の登記情報検索を使って、会社名を検索すると、ヒットしなかった。
次に、「その会社名 scam〔←詐欺のこと〕」の検索語でGoogle検索をすると、LinkedInで当該の会社について議論しているページが見つかった。
ページを投稿したユーザーによれば、彼も同じような面接に関するメールを受け取り、自分は注意深いと思っていたが、あやうく引っかかりそうになったそうだ。
彼が公開しているレターを見ると、自分が受け取ったものと同じだった。
だが、書かれている会社名が違った。
どうやら、求職者を狙って詐欺を常習的に繰り返しているグループに自分も引っかかりそうになっていることに、このときはじめて気づいた。
問題の会社のウェブサイトで使われている画像をGoogleで検索すると、ロゴマーク(つまり社名)だけが違うが、まったく内容が同じウェブサイトにたどり着いた。
つまり、詐欺グループが、イギリスの地方に実在する会社のウェブサイトを丸ごとコピーし、ロゴマークだけねつ造して、それらしいウェブサイトをでっちあげているわけだ。
これを書いている時点で、偽会社のウェブサイトと、LinkedIn上の偽会社のページはまだ存在している。
手続きの不備があったせいで、結局自分は1円もなくさないですんだけれど、だまされたんだなーという、がっかり感が残った。
自分はそれほど必死に焦って転職しようとしているつもりではなかったけれど、高い給料と魅力的な仕事内容をちらつかせられると、あっさり騙されるんだなと、脱力してしまった。
●動画広告が流行ってるらしい。これからは動画広告だとか、効果が高いとか
Googleが検索結果に動画広告を検討している噂なんかも出てきたし、ここはてなでも動画広告が出てくる。
私は動画広告が嫌いだ。音がうるさいし、音のないものでも動くと目について目障りで、
こんなものに時間を、PCの処理性能を、通信速度を、自分の思考能力の一部をとられることに腹が立つ。
そしてブロックする。通常の広告であれば内容によってブロックしないけど、動画は100%有無をいわさずブロックしている。
はてなのみなさんはどうだろうか
私は動画広告はインターネットの広告業界にとってトドメの一撃になると考えている。
広告ブロックが加速し、インターネットとの接触時間を減らすトドメの一撃に。
そうなればそれは広告効果が高いどころか、未来の広告業界の需要の先食いじゃないか?
●TVはCMがどんどんうざくなって、内容が糞になって、そこでポッと出てきたインターネットに潰されたけど、
インターネットはどうなるんだろうか。有望な代替がなさそうだから問題ないのかな?
海外では広告を出す側が自制をすべきではないかという動きが起こってきている。
CMの音圧を上げて目立つことを優先し、このあとすぐ!を連発し、
そしてCMカット機能付きのレコーダーを潰し、デジタル化で今までのTVで見れなくなって客離れは決定的になった。
広告を守ろうと、広告を見せようとすればするほど人はTVから離れていった。
もちろんTVの内容が広告重視になりすぎて見るに耐えない内容になったのもあるだろう。
でも、音圧を上げる、この後すぐ!で引き延ばす行動も、当時は広告効果が高いとか言われてたんじゃないのだろうか?
広告効果が高い、でユーザーを軽視していった結果潰れていった業界の見本にならないだろうか?
インターネットで広告がこのまま増え続けるとどうなるだろうか。
広告はどんどん派手に、邪魔になっていったが、動画広告黎明期の今ですら、広告ブロック問題が火を吹き始めている。
動画広告がそれほど普及していないにもかかわらずこれらの現象は起こっている。
そして動画広告というのは多くのユーザーの堪忍袋の緒を切るラインだと私は考える。
A、殻を作って閉じこもる
ユーザーは頻繁な追跡広告や、邪魔な動画広告、場違いなエロ広告などに嫌気が差し、
それらを行うサイトに行かず、安心できるサイトに引きこもってしまう
これらABCの複合型が生まれると思っている。これらの複合型とはどういう人間か。
同じサイトばかり見るために、新規遭遇の広告が少ないため、徹底的に広告をブロックできる。
そのうえ、ネットを見る時間が少ないために、ただでさえブロックされる広告の視聴頻度が更に下がる。
広告ブロックが普及すればネイティブ広告が増えるだけであり、インターネットはつまらなくなる。だからブロックはだめだという声を聞くが、
それはTVショッピングと広告番組に嫌気をさされ視聴者離れを起こしたTVと同じ自滅の道だ。ネットとユーザーの接触時間が減ってしまう。
広告があるからインターネットは面白い、という話は一理あるが詭弁でもある。
広告がなかった時代や広告が少なかった時代のネットはつまらなかったか?そんなことはない。私の体感では今より面白かった。
広告があるから存在できる面白いWEBもあれば、広告を見せることが目的のつまらないWEBもとんでもなく増えた。
私は、後者の害のほうが大きかったのではないかと思う。
●上述したABCの行動に見覚えはないだろうか?すでにTVもこのような道を辿っているのだ。
垂れ流しをやめ、同じ番組しか見なくなり、CMをカットして視聴する。それと同じ行動だ。
過剰な広告でポストにチラシ禁止を貼る家庭が増えたように、一定ラインを超えると、人は防御行動を起こしてしまう。
不要な情報の洪水に対し、殻を作ってしまう。得るものより、ゴミが多ければその傾向は一気に進むだろう。
どうでもいいチラシの束や、「重要」と「工事のお知らせ」とか書いてある光インターネット勧誘とか、
検索に引っかかってユーザーに踏ませることだけが目的の中身の無いサイトとかだ。
買い物でも何でも得るものより損が多ければまたやろうとは思わないはずだ。
駅前チラシは貰いたくないけど、ティッシュならもらってもいい気分になるでしょ?要はリターンが釣り合うかどうか。
過去のメディアの自滅例や今のメディアの考え方を見ていると無理だろう。
おそらく「広告ブロックを使うやつは結局使う。そういうことをしない人にどんどん広告を見てもらえばいい」と判断してそのまま進むだろう。
それは、いままで広告を許容していた人、インターネットとの接触時間が多かった人、を徐々に減らしていく道だ。
TVのようにどうしようもなくなるまで進むのか、引き返すか。今が分岐点でありメディアの方には考えて欲しいところだが、
日本のWEB広告は無法地帯であり、一人がやめても影響は薄く、全体に意見を波及できるようなリーダーもいない
どうしようもないのが現実だろう。
●人々はインターネットをやめるか
やめないだろう。ほかに変わるメディアがない。
ただし、上述したようにインターネットとのつきあい方が変わり、娯楽から道具に位置づけを変える人が増えるだろう。
道具になり、インターネットとの接触時間が減れば、それは広告との接触の現象を意味する。
結果広告業界には衰退が訪れる。
●オマケ:インターネットに取って代わる、というほどではないが、将来的に本が少し見直される時代が来る可能性がある。
ここ10年、本というのはゴミのような扱いだ。なにしろネットで調べたほうが速くて、タダだ。
雑誌もどんどん死んでいる。
でもラジオが見直されたように、本も良い特性を持ったメディアであり、息を吹き返すに足る素晴らしさを持っている。
これには電子書籍も含まれる。のでインターネットの範疇とも言える。
本というのは素晴らしい情報がわかりやすく集約されたもので、インターネットのようにいちいち検索する必要が無い。
広告があってもすぐ飛ばせる。純粋に中身を楽しめる。雑誌は広告が多すぎて有益な情報は少なかったりするのだけど。
なにより本は、専門的な用語を知らなくても、情報を教えてくれる。
今のインターネットは検索が大変で、専門的な、少範囲を意味する用語で絞り込まないと答えにたどり着けない。
たどり着いても水で思い切り薄めたカルピスのような中身しかない事が増えた。
以前なら検索だけですぐに芋づる式に情報を引き出せたが、今はそうは行かないのだ。
なにより、目に優しいので寝る前にピッタリだ。電子ペーパー以外のタブレットで見る場合には当てはまらないが。
ネットの情報検索の利便性は本に取って代わられることはないが、より深く知りたい、新しい分野を知りたい、
ゆっくりと自分の時間を楽しみたい人にとってはネットは本より劣るのだ。
ネットがどんどん不便になればなるほど、不便だったはずの本と一部で逆転することになる。
http://anond.hatelabo.jp/20100217113611
入学前参考にした覚えがあるので
ひとり暮らしはしてなかったし
その1 医療費補助を申請しよう
http://www.waseda.jp/student/hoken/gojyokai/iryokyuhu-p01.html
新歓期はアルコールパッチテストなどを実施しているありがたい団体
ご紹介したいのは、ここでは日常生活でかかる医療費を補助してもらえること(上限年間6万だったかな)
事前に本人名義口座を登録して、学生証と領収証を受付に持っていけば数カ月後に
かなり助かるので是非使うべきだと思う
http://www.wul.waseda.ac.jp/imas/
図書館の使いこなし方や論文・文献を見つけ出すノウハウみたいなものは
ログインしさえすれば1970年代からのほぼすべての記事を検索できる
自分の興味あるワードで検索すると見出しがずらっと出るから時代ごとの変遷が見て取れて
就活シーズンが近くなったら企業名や業界のワードで検索してみるのもいいかも
その3 映画を見よう
本を読むの大学生の特権?だけど 映画も時間のある大学生ならではだと思う
テーマを設けて国内外のいい映画をやってるから時間を見つけて行くといいよ
2本立てとかを見終わると日が暮れてたりして愕然とするけど笑、不思議と松竹で見た映画は印象に残るよ
図書館でもミニブースで映画は見れるから、授業の間が空いてたらいくのもあり
その4 運動しよう
学生会館の地下には、かつて小島よしおも通ったというジムがあって
http://ameblo.jp/wasedanosusume/entry-10228174332.html
年間2000~3000円で綺麗な設備を使える 授業の合間に行きやすい
ガーデンプレイスでヨガとかやってるから女子はそれもいいと思う
戸山キャンパスの文カフェの地下にはプールがあって、初めて見つけた時は目を剥いたけど
http://waseda-sports.jp/news/34832/
バルセロナ水泳とかに出ちゃうレベルのガチボーイが隣のレーンに泳いでたりするので
参考にもなるし、マンモス校のはずなのにやたら空いているのでおすすめ 1回100円
全学部生が聴講出来るオープン科目というものがある 語学、教養、IT、ボランティア、スポーツとか
それらを余裕のある曜日にとるのも、楽しく運動不足解消・友達作りも兼ねてということでいいかもしれない
その5 工作しよう
ろくろからレーザー加工機まで 多彩な設備を使わせてもらえる工房がある
http://www.koubou.sci.waseda.ac.jp/
中々有意義な時間を過ごせる DIYとか興味がなくても、行ってみればムクムクと
その6 ピクニックをしよう
残念ながら早稲田はICUみたいなばか広い芝生があるキャンパスではない
http://www.city.shinjuku.lg.jp/seikatsu/file15_03_00011.html
暖かい日は、お弁当かサブウェイのサンドイッチでも持って行くと気持ちいいよ
その7 就活どうしよう
入学式で、「早稲田に入ったあなたが出世するかどうかは保証できないが、あなたの友だちが出世することは確実だ」
みたいなこと言われたけど、卒業する今まわりの進路を見るとなるほどねって感じはする
さて、あなたがこれから日本で就活ゲームに乗るかどうかは自由だけど、もしやるならキャリアセンターは足繁く通うといいと思う
waseda net portalのキャリアコンパスコーナーに、内定先ごとの卒業生の就活振り返り記みたいなのがあるんだけど
これは参考になるし読み物としても中々面白いので、就活どうしようかなってときはここを読むことから始めるといいよ
その8 その他おすすめのお店
http://www.yelp.co.jp/biz/%E5%B1%B1%E6%89%8B%E5%8D%93%E7%90%83%E5%A0%B4-%E6%96%B0%E5%AE%BF%E5%8C%BA
映画版「ピンポン」に出てくるような昭和館溢れる卓球場 馬場近くの栄通りにある
やたら上手いミャンマー人たちのカットマンぶりを見られるかもしれない
・早美舎
http://www.sobisha.com/shop.html
レポート提出間際、パソコン室のプリンターは混んでてアテにならない
そんなときはここに駆け込むべし 若旦那が神の如き手捌きでUSBからPDF印刷してくれる
http://tabelog.com/tokyo/A1305/A130504/13006270/
親戚のおばちゃん家きたみたいな感じを味わえる韓国料理屋さん
ここらはかなりエキセントリックな体験が味わえるので
1年生のうちに友だち誘って挑戦して、
後輩ができたらご馳走しに連れてってあげると面白いかも
自分は生協加入しなかったけど、結構電化製品とか色々売ってるし本が安いし
amazon代わりに使ってたら結構お得だったかなと思わないでもない
やたら新入生にゴリ押ししてるパソコンは買わなくていいよ レッツノート自体は性能いいけど
くぅ~疲れましたw これにて完結です!
もっと色々書きたい気もするけど
さて、
新入生はいい友だちできるといいね
ひとりでも楽しめることは、上記以外でも沢山あるし
ソニー、電子書籍ストアを北米市場から撤退。ReaderユーザはKoboへ移行対応
http://japanese.engadget.com/2014/02/06/reader-kobo/
こないだもローソンの撤退があったし、Amazonがこの分野では一人勝ちしていくのだろうか。
電子書籍を購入した経験はないがスマホのアプリで無料のものだけは小説や漫画等には触れている。
書籍を電子化する事には確かに利点があって、いつでもどこでもスマホやタブレットさえあればいつでも読めるし、保管場所を取ることもない。
あるいは書籍が電子化という形態変更をする意義はなんなのだろうか?
例えば、物理書籍としての百科辞典は絶滅の危機に瀕しているし、辞典・辞書などもその運命にあるだろう。
その座を脅かし続けていた電子辞書といった製品群もスマホの勢いに抗しきれなくなっている。
それらは物理書籍の電子書籍化ではなく、情報検索・情報提供の形態自体がWeb・IT化してしまい、存在意義がなくなってしまったといっても過言ではない。
電子書籍化すらされず概念としての生存権すら奪われてしまった。
IT化は、単なる見かけの形態の変容ではなく、いわばパラダイムそのものを変えてしまったのである。
そのパラダイム変革の中で書籍文化が生き残りをかけた戦い方が電子化なのであろうか?
だが物理書籍に比して電子書籍が如何に利点があるとは言え、結局のところ旧態依然とした概念形態を守り続ける限り、防戦が精いっぱいで電子書籍が繁栄を許されることはあり得ないと思うのだが。
http://d.hatena.ne.jp/oneshotlife_tom/20130418/1366264835
"on lisp"でぐぐるとトップに出てくる草稿置き場を見ずに
Download 無料で手に入るものにお金を払うってどうよ?! ポール・グレアム氏の知に対して対価を支払うのではなく、質の悪い翻訳に対して対価を支払っているのかと思うと悲しくなってきた
(注 現在この文は変更されている模様)
とか言っちゃってるのがなんというかかんというか。
なおon Lispの日本語版は決して質の低い翻訳ではありません。野田くんは、2005年の時点ではすでに翻訳を開始していた(と思う)。で、2005年だったか、2006年だったかに出版の話があったようでその後2007年に発売されたわけだが、当時Lispの情報ってあんまりなくて、翻訳苦労してるみたいなことをはてダに書いていた(ような気がする)。
あと学術関係の書籍は逐語訳をすれば出来上がるものではなく、まだ存在していない語を新たに作ったりとか、日本人が正しく元の言語と同じイメージを描けるように訳語を変える(数学系か物理系か情報系かでまたイメージするところが変わるので難しいが)とかいろいろ工夫が必要。また、実践系の書籍、特にWebに挙がってるタイプや、著者がつらつらと書いたタイプ(レガシーコード改善ガイドみたいな)とかは元の文章が読みにくかったり、例に間違いがある場合もあり、それをわかりやすく整理するのも訳者(編者)の仕事になっていて、日本語のほうがよっぽどわかりやすい場合もある。そういう編集作業に対価は発生しているのだ、となんで考えないんだろう。
というか良い物をただで貰えるというのは単に著者が良い人なだけで、基本的にはよいものを手に入れたらそれに対価は払うべき。なにただのりしてんだよ、というのもある。
しかも2007年発売で未だ発売されてる本だぞ。評判とか前もって検索しなかったのか?今買っときゃなくなる本でもあるまいに本屋で見かけてから家に帰って調べる時間くらいあるだろう。ネットで買うならその前にググれば草稿版も原文もでてくるのに。
というわけで表題に戻るわけだが、世の中には著しく情報検索能力もしくは試行錯誤能力が劣る人々がいるらしいということは、僕もそろそろ大人になったので理解している。情報検索能力(もしくはその情報の精査能力)というのがなければ対価を払って上げ膳据え膳で情報をもらうしかないんですよ。そこらへんはビジネスチャンスになるので、頭の良い人はみんな情報検索能力をもっとあげるべき!とは言わない。むしろ知らなくていいよ、日本語だけ出来ればいいのよというだろう。そんで文句をいってもちゃんとはいはいって言って聞いてくれる。それはビジネスだから。
ググりはするけど試行錯誤能力が異様に低い人間というのもいる。まぁいってしまえばググって上の3つの候補しかみない、みたいな。3つの候補で目的を達成することのできる検索能力があればそれはそれで構わないとは思うが、大抵の場合そういうわけにはいかないわけで、候補からキーワードを抽出してそれでググり直して、もしくは不要な語を覗いて再検索をかけて目的の情報に到達するためにはやはり試行錯誤能力が必要だ。もちろんできなくてもたぶん問題ない。それもビジネスチャンスになるから、代わりに調べてくれて代わりにやってくれる人もいる。それで文句を言ってもやっぱりはいはい聞いてくれる。ビジネスだから。
俺は面倒くさがりなのと自分を棚上げして文句いう奴嫌いなのでとっととググれクソが、と思うけどな。ていうか金がもったいないならググれよ!ケチならケチなりにただで提供していただいている検索エンジンをおもいっきり活用して、必要なところに必要なだけ金を使えよ。対価を支払うべき相手にきちんと自分が得た価値の分だけ対価を払えよ。それができないなら頭下げて金でも払ってろうんこうんこ。
Webシステムとは縁遠い事務職のリーマンが、ある日思い立って、ニッチな用途の検索エンジンサービスを作ってみたので、ちょっと書いてみようと思います。
ちなみに、検索エンジンといっても、googleカスタム検索とかのお茶濁し系じゃなくて、apache Solrというオープンソース検索エンジンを、VPS上で動かしているという、それなりに本
気度の高いものです。
なんで素人がそんな物騒なものを動かす羽目になったかは、後述。
やりたい構想みたいなことを思いついたのは、もう6、7年前ほど前のこと。初めて独り暮らしを始めたときに、ひどく不便を感じたことがあり、こんなサービスがあったら便利だなあ、
ちなみにその妄想をふと高校の同期に話したとき、そのサービスはどこにあるのか?!と、えらくがっつかれたのを、覚えてます。まあ、俺と同じく偏執狂の奴だったからだと思います
が。
ただ、しがない事務職リーマンということもあり、当然、技術も無く、そのときは、やるならこんな名前のサービス名だろうなあ、とか、そんな妄想レベルで、話は終わっていました。
そんな感じで、5年ほど月日は経ち、なんとなくリーマン人生の流れも見えてきたところで、以前、妄想していたことを、ふと思い出しました。
5年も経ったら、さすがに自分が考えたようなこと、誰かがやっているだろうと調べてみたところ、意外なことに、競合になるようなサービスは存在せず。ちょうど異動があって、少し時
間が出来たこともあり、じゃあ、着手してみようかと思い立ちました。
やりたいことは、大手サイトの情報検索。ただ、商品ページ内の特定情報、それも、商品ごとに正規化されていない表記を、正規化して抽出する必要があったので、大手サイトの既設API
だけではとても実現不可能でした。
まあ、だからこそ、5年間、誰もやろうとしなかったんでしょうが。
ということで、とても一発では解決できなさそうな内容だったので、自分でなんとか実現できそうな機能に細分化して、各個撃破していくことにしました。
随分と考えた結果、
以上に区分できると考えて、これらを各個撃破していくこととしました。
また、技術もなく、プログラミングも出来ず、ましてやlinuxサーバのお守りをしたことなんて当然ないので、インターネット上に置くサーバですべての処理を完結させるのではなく、イ
ンターネット上に置くリソースは最小限に留め、できる限り、勝手がわかる自宅のwindowsパソコンで処理を行うことにしました。
ちなみにさらっと結論だけ書いてますが、ここまで至るまでに、いろいろと調べ続たり、考え込んだりしていたので、思い立ってから3ヵ月は掛かってます。。。
さて、やる方針を決めたあと、はじめに着手したのは、要の検索エンジンサーバです。
いろいろとググって調べて、mySQLというやつか、apache Solrというやつかに絞りましたが、結局、Solrを使うことにしました。
MySQLのほうが実績は多そうだったのですが、Solrのほうが検索専門で、滅茶苦茶動作が速いらしいということ、MySQLでも出来るが特に速度が遅いらしい全文検索機能も使いたかったこ
と、あとファセット機能がジャンル絞りこみに便利に使えそうだったので、というのが理由です。
ちょうどSolr本が発売されていたこともあり、それを参考に、自分が使うように設定ファイルを変更していきました。
しかし、初めは設定ファイルの内容も意味不明な上に、私の書き方も雑なのか、少しいじっただけでまったく動かなくなる。結局、設定ファイルを一文字ずつ変更しては動作検証、とい
った始末で、進捗は地を這うよう。ある程度思い通りにSolrを扱えるようになるまで、3ヵ月以上掛かったでしょうか。。。
さらに、検索エンジンのフロントエンド(Solrの検索結果を、htmlに変換するプログラム)も書かなければならない。プログラミングが出来ない人間には、これが本当に辛かった。
Solr本に、いろんなプログラミング言語でサンプルがあったのですが、迷った末に、わずか数行なら書いた(≒コピペした)経験があるという理由で、javascriptを苦渋の選択。
しかし、選択はしてみたが、基礎が本当に無いから内容がサッパリ頭に入ってこない。こちらも、わかるところから本当に1文字ずつ変えていくといった手探り状態。
プログラミングについては、今回のためだけだから、といった理由で、一切基礎をやらずに着手したのが裏目に出たのか、サンプルのソースをモノにして、書き上げるのに、ゆうに半年
以上。本当に時間が掛かりました。
さらに、Solr周りで計9ヶ月間ハマっていた頃、忘れもしない、kanzen21のおっさんが彗星のように現れて、衝撃を受けることになります。
大手サイトのページをクロールして検索エンジンを作る手法は、私と考えていた構想の枠組みとまさに「完全に一致」な訳で。。。
図書館事件に注目していたのも同じで、あまりの一致具合に衝撃を受けっぱなしでした。
その後の成り行き等も含めて、興味深く観察させて頂き、本当に参考になりました。
そんな感じで紆余曲折もありましたが、ようやく難題だった、プログラミング関連に目処が立ってきたので、あとはクローラと肝心のデータ処理です。ここからは、勝手知ったるwindows
まず、クローラですが、専用のクローラをwindows用に探してきたり、それを設定するのも大変なので、今回はテレホーダイ時代に使っていたような、フリーのweb巡回ソフトを利用する
こととしました。指定のhtmlをダウンロードしてくるだけなので、別に変に新しいものに手を出す必要もないので。
また、ダウンロードしてきたhtmlファイルについては、これまたフリーの日本語処理ツールでcsv方式に加工することにして、処理ルール部分を相当に作り込みました。
このあたりは、全体を通して見てもキモの部分なんですが、ある意味、ちょっとしたパズル感覚だったので、プログラミング言語の部分と違って、かなり楽しかったです。
あとは、msdosのバッチファイル(これは前から知っていた)で、これらの処理を繋ぎ、cygwinのcurlとかいうツールで、連続して検索エンジンサーバにcsvファイルをアップロードする
仕組みを作りました。
検索エンジンサーバには、容量は少ないが、安くて高性能という、今回の用途にピッタリだった、さくらのVPSを借りて設定。CentOSのサーバ構築ホームページを見ながら、サーバとか
Solr管理URLとかにセキュリティを掛けて、こちらも素人ながら、意外とすんなり設定。
ホームページは、vpsサーバに相乗りさせるのではなく、別にさくらのレンタルサーバを借りました。apacheの設定方法等を習得する必要がありませんし、vpsのリソースをapacheと分け
合う必要が無くなるので。ホームページのhtmlファイル、cssファイル等も調べながら設定し、画像も準備しました。
あと、構想を思いついたときに妄想していたサービス名の.comドメインは、すでに他者に取得されていたのですが、どうも使っている風にも見えなかったので、whoisで出てきたメールア
ドレスに連絡して交渉し、幾ばくか払って買い取りました。
結局、足かけ18か月。ようやく完成。
楽天市場の家具を、幅x奥行x高さ(家具サイズ)で検索できる、楽天市場・家具カテゴリ専門の検索エンジン
この商品数規模(データ収録約30万アイテム)で、1センチ単位で家具のサイズ指定検索が可能な手段は、商用サービスも含めて、ほかには存在しないと思います。
kanzen21と違って、エロじゃないから華はないけどね。。。
ちなみに冒頭で少し書いたきっかけですが、就職して独り暮らしを開始したときに、新しい家にピッタリサイズの家具が欲しかったのですが、これが楽天で探すのは至難の技でして。
楽天で家具を探してみようと思った人には判っていただけると思うのですが、楽天では、価格では範囲指定やソートができても、サイズでは検索出来ないんです。
これは、楽天では、商品のサイズ情報は商品の自由記述欄に記載することになっているためで、商品ごとにサイズの記載方法がバラバラのため、検索が事実上、不能となっています。
家電製品とかに関しては、種類が少ないこともあり、メーカーのホームページとかでサイズを確認した上で、商品型番で検索すればいいので、それほど問題にはならないのですが、家具
って、種類が非常に多く、型番もあったり無かったりで、家電のようにサイズを調べることができません。
・・・ということで、カグサイズでは、楽天の商品ページにいろいろな書式で書かれているサイズ情報を拾って解析して正規化し、範囲指定やソートして検索ができるようにしています
。
また、単に寸法サイズを拾うだけでは、梱包サイズとか引き出し内寸とかも引っ掛かってしまうので、それらは出来るだけ排除して、商品の外寸が優先して引っ掛かるよう、アルゴリズ
ムを調整しています。
単位(センチとミリ)に関しても、商品ごとにバラバラ(単に単位だけでなく、商品説明のどこに"センチ"とか"ミリ"と記載しているかについてもバラバラです。)なので、サイズ表記
の前後の状況をみて、正しいと思われる単位で拾うようにしています。
あと、変わった使い方としては、欲しい家具の価格比較みたいなこともできます。
家具は、同じ商品でも、店ごとに型番が違ったりすることがよくあり、簡単には価格の比較が行いづらいジャンルの商品です。
しかし、型番は違っても、同じ商品なら原則、サイズは同じですから、欲しい商品とまったく同じサイズで検索をかけると、同等商品があるのかどうか比較しやすい・・・といった使い
方もできます。
と、そんな感じで、しがない事務職リーマンが作ってみた、ニッチな用途の検索webサービスを、サービスインさせて頂きました。
一般に公開されていて、誰でもアクセスできる情報でも、ニーズが有りそうな切り口の条件で検索性を高めれば、新しい価値を創造できるんじゃないかという実験です。
もしよろしければ、ぜひ、使ってみてくださいー。それでは!
----------
知的財産戦略本部;インターネット上の著作権侵害コンテンツ対策に関するワーキンググループ第7回(2010/05/18)実況ツイート
資料より抜粋>http://www.kantei.go.jp/jp/singi/titeki2/tyousakai/contents_kyouka/dai7/siryou1.pdf
現状:侵害コンテンツへのリンクを集めたリーチサイトが著作権侵害を助長・拡大
世界中に分散する著作権侵害コンテンツへのリンクを集めたリーチサイトによって、アクセスが容易となり、著作権侵害を助長・拡大している。
○ これらの一定の行為については、著作権侵害に該当する場合があると考えられるが、直接の侵害者ではないこともあり、その範囲が明確でない。
世界中の様々なサーバーに掲載されている著作権侵害コンテンツへのアクセスを容易にするため、
それらへのリンクをまとめて掲載するリーチサイトが数多く存在し、著作権侵害コンテンツの閲覧を助長している。
リンクの態様は、深度によって大別できる。
例1:他の動画共有サイトに投稿されている動画ファイルにリンクを張り、当該サイトにおいて視聴できるようになっているケース。
例えば利用者が多く多様性の高いインターネットの掲示板が、その使われ方によっては、この『リーチサイト』として当局に認定される可能性もある。また、一種のコピペブログなども同様だろう。さらに言えば、検索条件を狭めて検索が可能な情報検索サイトも、ひょっとしたらリーチサイトとして、当局がその気になれば摘発可能かも知れない。なんだか曖昧だなあ。
最近のこの手の議論って、もう「手段がダメ」と言うより「意図がダメ」という主張で裁けるようにしてしまおうって話が多い気がするな。こわいこわい。
ネットで誹謗中傷を書かれた時に、法的に個人を特定する方法.記事本文編集する履歴仕事・学習 ネットで誹謗中傷を書かれた時に、法的に個人を特定する方法
著者: けんすう
お気に入りに追加 .はじめに
インターネットは便利ですが、誰でも情報発信ができる以上、個人情報を書かれたり、悪質でひどい誹謗中傷を書かれたりするリスクがあります。
今のネット社会では、少しくらいの批判に反応するのは効率的ではありません。しかし、自分の生活や家族、大切な人にまで害を及ぼすような誹謗中傷をされたり脅迫をされた時は法的な処置をとらざえるを得ない時があります。
最初にやること
まず、一番最初に何をやらないといけないか。それは
というところです。
それはたいていの場合、IPアドレスと呼ばれるものです。IPアドレスとは、インターネットに書き込む時に記録される発信者番号のようなものです。
mixiなどの会員サイトでは、会員情報を運営者が持っている場合もありますが、今のところ、誹謗中傷を書かれるのは匿名系の掲示板が多いので、それを前提に書いていきます。
発信者番号の知り方
では、発信者のIPアドレスを知るにはどうしたらいいでしょうか?方法は大きく分けて3つあります。
警察経由で聞く
裁判所経由で聞く
下に行くほど敷居が高くなります。詳しく見ていきましょう。
これが基本。とりあえず、そのサイトや、掲示板の管理者にメールをするのが一番簡単。
ここではあまり感情的にならないで依頼をするのが一番スムーズです。「提出しないと訴えますよ」のような脅しは逆効果なこともあるのでオススメしません。相手もけんか腰になってしまったら、無駄なもめ事を増やすだけです。
「書いた人を訴えたいので、IPアドレスを提出をお願いいたします。管理者責任を追及するのではなく、発信者を提訴するためのものなので、出していただければあなたに対して面倒はかけさせません」
という旨をきちんと伝えるのがよいです。
個人情報なので出せない、という人に対しては、「プロバイダ責任制限法案があるので、明確な理由がある限り、開示者の責任は問われない」ということをしっかりと教えてあげましょう。
開示してくれたら、そのIPアドレスを持って、警察に行くか、裁判所に行くかします。そのフローについては、2、3をごらんください。いったん、掲示板管理者がIPアドレスを出してくれないというフローに基づき、2と3を説明します。
警察経由で聞く
書かれたサイトの管理者にIPアドレスの開示のお願いをしても出してもらえなかった場合。その時は警察にいきましょう。
ポイントとしては、書かれた掲示板をプリントアウトし、警察の受付で
「掲示板で誹謗中傷を書かれたので、刑事告訴しようと考えています。刑事課までお願いします」
と伝えることです。
単にインターネットの「書き込みで困っている」というと、生活安全課などに案内されることが多く、悩み相談を聞くレベルで終わってしまう場合があるので注意が必要です。
刑事課にたどり着いたら、誹謗中傷された旨を伝え、プリントアウトした記事を見せ、掲示板管理者の連絡先を教えます。また、警察のほうから、書き込み者のIPアドレスを捜査関係事項照会書を持って開示請求をしてもらうようお願いをします。
多くの掲示板の管理者は、この対応でだいたいIPアドレスを素直に出してくれます。
裁判所経由で聞く
掲示板管理者に対して、訴訟を行います。開示請求の訴訟ですね。難しそうですが、実はそんなに大変ではありません。一度、弁護士さんに頼んで、手続きを教えてもらうのがいいでしょう。あとは弁護士をつけずに自分個人で対応できます。
たいていの裁判が、2、3回ほどやり、掲示板管理者がIPアドレスを出す、という和解方法を裁判所から提示して来ますので、それで終わりです。
そして、そのIPアドレスをもって、次はプロバイダにIPアドレスからの個人情報請求訴訟を起こします。その裁判が終われば、書いた人が特定できるので、あとは訴えるなり、和解するなり好きなようにできます。
ただし、これには非常に大きな問題があります。
まず、掲示板管理者の個人が特定できない場合。これは訴えることすら出来ないので非常に大変です。一番まともな方法が、サーバ管理会社に対して接続している管理者のIPアドレスを開示してもらい、そこからプロバイダに対して開示請求訴訟を起こし、管理者を特定した上で、管理者に対して発信者のIPアドレス開示をするという方法になります。
上記の方法で、発信者情報がわかったら次はIPアドレスから個人の情報を取得します。
これは、プロバイダに聞かないとわかりません。よって、IPアドレスから割り出したプロバイダに対して、個人情報請求をします。
これも二通り方法があり
警察経由で聞く
裁判所経由で聞く
となります。
警察経由で聞く
IPアドレスを持ち、この人を刑事告訴したいのだが、と言います。なれた警察の方では、そこからプロバイダへ個人情報の請求を行ってくれます。
「IPアドレスだけじゃプロバイダがわからないのでどうしたらいいのか」
と警察が言ってきた場合は、ドメイン/IPアドレス【whois情報検索】を教えてあげましょう。このサイトではIPアドレスからプロバイダがわかります。
刑事告訴する意志がはっきりある場合はきちんと対応してくれます。しかし、民事の範囲内ですと、民事不介入で断られてしまう可能性もあります。
裁判所経由で聞く
警察でダメだった場合は、プロバイダにたいして個人情報の開示請求の裁判を起こすことになります。
これも自分でやってもいいですが、相手が大きな会社になりがちなので、弁護士に頼むのも手ではあります。
フローの確認
ここでようやく、個人情報を手に入れることができるので、それをもって名誉毀損で裁判したり、和解したりすることができるようになります。
さて、ここまで読んでくださった方はお気づきかもしれませんが「発信者を特定するのは大変」ということです。一番の方法が警察に行くことですが、それがうまくいかなかった場合、個人を特定するのは現在の法律では非常に困難です。
もう一度フローを確認すると
プロバイダに対して、そのIPアドレスからの個人情報開示請求訴訟を起こす
という2つの訴訟が存在するということになります。しかもこれは掲示板管理者の連絡先がわかっている場合のみで、もしもそれがわからない場合は
プロバイダに対してサイト管理者のIPアドレスからの個人情報開示請求訴訟を起こす
プロバイダに対して、そのIPアドレスからの個人情報開示請求訴訟を起こす
となります。
その途中で、サイト管理者や、プロバイダが「ログをすでに廃棄してしまった」と言われれば、そこで追跡が困難になります。今のところ、発信者情報のログの取得の義務がプロバイダにはないため、裁判の途中でログをすでに削除されてしまっている可能性もあるわけです。
おわりに
というわけで、個人を特定するのは大変なのですね。一番簡単な方法が、すごくがんばって、警察に協力してもらう、という戦い方なので、がんばって警察の方に動いてもらいましょう、、、というのが精一杯のアドバイスだったりします。
http://www3.library.pref.hokkaido.jp/cgi-bin/hokkaido_top.cgi
http://www.plib.net.pref.aomori.jp/opac/CrossServlet
http://www.library.pref.iwate.jp/iliswing/network/page/We_kensaku/oudan_index.html
http://www.library.pref.miyagi.jp/wo/crs/crs
http://www3.apl.pref.akita.jp/
http://www.lib.pref.yamagata.jp/crosssearch/index.html
http://www.cross.library.fks.ed.jp/fukushima_top.html
http://oudan.libnet.pref.ibaraki.jp/cgi-bin/ibaraki_top.cgi
http://kensaku.tochilib-unet.ocn.ne.jp/cgi-bin/ilisod/odplus.sh
http://www.library.pref.gunma.jp/cgi-bin/ilisod/odplus.sh
http://cross.lib.pref.saitama.jp/
http://www.library.pref.chiba.lg.jp/cgi-bin/ilisod/odplus.sh
http://www.klnet.pref.kanagawa.jp/opac/CrossServlet
http://www.pref-lib.niigata.niigata.jp/cgi-bin/ilisod/odplus.sh
http://lib1.lib.pref.toyama.jp/public/collect/libsel.aspx
http://www.library.pref.ishikawa.jp/htdocs/cross/index.html
http://www.library.pref.fukui.jp/cgi-bin/ilisod/odplus.sh
http://soumoku.lib.pref.yamanashi.jp/servlet/jlibnet.servlet.StatefulServlet
http://www2.library.pref.nagano.jp/
http://www.library.pref.gifu.jp/oudan.htm
http://oudan-kun.tosyokan.pref.shizuoka.jp/shizuoka_top.html
http://www.aichi-pref-library.jp/oudan/aichi_oudan_f.htm
https://idx.milai.pref.mie.jp/MEPUTL/servlet/search.inp_cond
http://cross.shiga-pref-library.jp/cgi-bin/shiga_top.cgi
http://www.library.pref.kyoto.jp/cgi-bin/ilisod/odplus.sh
http://www.library.pref.osaka.jp/cgi-bin/book.cgi
http://www2.library.pref.hyogo.jp/cgi-bin/ilisod/odplus.sh
http://opacsvr01.library.pref.nara.jp/cssys/index1.html
http://opac.library.pref.tottori.jp/cgi-bin/ilisod/odplus.sh
http://opac.lib.shimane-u.ac.jp/mutual/
http://oudan.libnet.pref.okayama.jp/index_default.html
http://www.hplibra.pref.hiroshima.jp/hplib/hpsomoku-fr.htm
http://library.pref.yamaguchi.lg.jp/cross/index.html
http://svdmzlcs01.tokushima-ec.ed.jp/ilisone/
http://www2.library.pref.kagawa.jp/
http://pref-liball.kochinet.ed.jp/agent/index2.htm
http://www2.lib.pref.fukuoka.jp/wo/crs/crs
http://www.pref.saga.lg.jp/manabi-kensaku/
http://odn.lib.pref.nagasaki.jp/
http://www2.lib.pref.miyazaki.lg.jp/cgi-bin/ilisod/odplus.sh
http://www.library.pref.okinawa.jp/cross/
http://www.jla.or.jp/link/public.html
非モテ の検索結果 約 1,240,000 件中 1 - 10 件目 (0.08 秒)
他のキーワード: はてな 非モテ 非モテ タグ 非モテ ミソジニー 革命 非モテ 非モテ 2ch
他のキーワードが出るってことは、上に書かれた数は検索総数を意味しないということだよな、
というわけで少し絞るとこんな結果になった。
非モテ -site:hatena.ne.jp の検索結果 約 2,760,000 件中 1 - 10 件目 (0.05 秒)
非モテ -site:hatelabo.jp の検索結果 約 1,230,000 件中 1 - 10 件目 (0.23 秒)
非モテ -site:hatena.ne.jp -site:hatelabo.jp の検索結果 約 539,000 件中 1 - 10 件目 (0.17 秒)
非モテ -site:hatena.ne.jp -site:hatelabo.jp -site:2ch.net の検索結果 約 547,000 件中 1 - 10 件目 (0.22 秒)
非モテ -site:hatena.ne.jp -site:hatelabo.jp -site:2ch.net -site:tumblr.com の検索結果 約 541,000 件中 1 - 10 件目 (0.29 秒)
ってなわけで、リアルで非モテとかなんとか言う奴はやっぱり増田に多いんだなーってことで。
この -siteって、情報検索してるときに邪魔でしょうがないソーシャルブックマークやつぶやき系、クリップ系のサービスを対象から外すのにとても便利。
いや、普段から映画を見に行っている人には常識なことだろうけど、“何年かぶり”に行く者にとっては
何年か前の方法を引きずっているから、ネットで確認もなにもしないってこってす。
よくテレビなんかで「映画人口が激減している!良い作品をもっと作らないと!」って危機感を言ってるけど、
(あなたの言うような)情報検索の仕方を知ってる人しか想定していないところに問題があるんじゃないか!と当時は怒ったのでした。
知らねー奴のことなんて知ったこっちゃねーよという姿勢が、映画人口の増加に繋がるとは思えないんですよね。
ちなみに私は神奈川県横浜市の住人で、映画を見に行くと言えば関内の東宝会館、伊勢佐木町の東映劇場、松竹ピカデリー、関内アカデミーというところで、どこも半券もぎりは一列並びでした。全部潰れたけど、そういう映画館界隈で映画館の入り方を学んだんですよ。もう通用しないんですよねー。
すごい、よくよく考えるとエロサイトはすごい。
経済的ロス以上の利益を与えてくれる!右手とおニンニンが見合うために健全な男子諸君は一日数時間にもおける動画検索を行っている。その時の集中力は……まじすごい!テスト前の一夜漬けとかのレベルじゃない!よく考えるんだ。どれだけエロ動画を選別するために自らの精力をかけているのか。性欲だけに精力がかかりまくってる!精力100%!!すごすぎる!!
健全な男の子たちはエロ動画を探すことによりより高度な集中力法を学んでいるんだ!!すごい!エロサイトは最高の集中力法習得場なんだ!!もう僕らにはつまらない通信教育にお金をかける必要はないんだ!僕たちはエロサイトを通して類稀なる集中力を養っているんだ!この養われた集中力から生み出される経済効果は無限大!!可能性がほとばしってる!まるで十代の性欲のように!!すごすぎる!!
けどエロサイトはもっとすごい。エロサイトは集中力を養うだけじゃない。エロサイトで最高の右手とおニンニンの仲介役を見つけるために健全な男の子は最高のネットリテラシーを育んでいる。数ある動画から最高の右手君とおニンニンちゃんの仲人を見つけるために健全な男子諸君は瞬時に莫大な画像とリンクがごった返すエロサイトを瞬時のスクロールし自分自身が求めている最高の動画と画像を瞬時に見つける能力.....これは現代社会がもっとも求めている情報検索だ!
エロサイトは情報あふれる現代社会を生き抜く方法を男子諸君に教えているのだ!すごい!エロサイトは本当にすごい!教育が16年かけてもできなかったことを健全な男の子に優しく包み込むように教えているんだ!!まるで右手がおニンニンを包み込むように!!!すごすぎる!謝れ!エロサイトに謝れ!エロサイトのせいで日本は経済的なロスを被っているとか言う奴謝れ!
確かにエロサイトは15歳の男女に学力差を生みだした。しかし考えてみよ。なぜ理系は男ばっかりなのか。なぜ医者、エンジニアなど高度な知識を必要とする職業は男性が多いのか......それはエロサイトによってである!右手とおニンニンの出会いのために健全な男子は多くの時間を費やす。しかしながらそこから学んだ女性が得ることのできない異常と形容しうる集中力と高度な情報検索能力は右手とおニンニンの出会いによって使うことのできる時間が女性よりも限られているにもかかわらず健全な男子が女性より優れた知性を得ることはできたのだ!
もしエロサイトがなければ社会は成り立たぬ!エロサイトは社会を向上させている!すごい!思ってたよりエロサイトはすごい!フェミニストは間違っている!グラスシーリングなど存在しない!存在するのは男だけがもつエロサイトに持つ熱き情熱と性欲だけだ!エロサイトが存在する限り男が女に支配権を譲ることはありえない!保護せよ!我らがエロサイトを保護せよ!無知なるフェミニストから、無知なる教育ママから我らがエロサイトを保護せよ!エロサイトなくして我らが繁栄はあり得ない!
素晴らしきエロサイトよ!なぜあなたはそこまですごいのか!!なぜ、どうしてエロサイトはエロサイトなのか!すごすぎる!エロサイトはすごすぎる!私たちの理解をエロサイトは超えている!エロサイトは文明の発達と共にある!
すごい、エロサイトがすごい!
http://takagi-hiromitsu.jp/diary/20080312.html#p02
Amazonとか個人情報について盛り上がってるみたいで、個人的にも少し気になったので復習がてらまとめてみた。
個人情報保護法の軽いまとめと、「注文履歴は個人情報には当たるのか?」という問題について。
昔読んだけど完全に忘れてるな。
第二条 この法律において「個人情報」とは、生存する個人に関する情報であって、当該情報に含まれる氏名、生年月日その他の記述等により特定の個人を識別することができるもの(他の情報と容易に照合することができ、それにより特定の個人を識別することができることとなるものを含む。)をいう。
例を挙げると、
この三つのうち、メールアドレスのみで個人情報に当たるのは、3のみ(多分)。
1は、「タナカさんらしい」ということは分かるが、フリーメールで、かつタナカという一般的な苗字なので、「特定の個人を識別する」のは不可能。
2は多少絞られるものの、これも特定は不可能。
3は「hoge社のタナカイチロウ」だと分かるので、(ほぼ)特定が可能。なので個人情報に当たる。
第十五条 個人情報取扱事業者は、個人情報を取り扱うに当たっては、その利用の目的(以下「利用目的」という。)をできる限り特定しなければならない。
2 個人情報取扱事業者は、利用目的を変更する場合には、変更前の利用目的と相当の関連性を有すると合理的に認められる範囲を超えて行ってはならない。
第十六条 個人情報取扱事業者は、あらかじめ本人の同意を得ないで、前条の規定により特定された利用目的の達成に必要な範囲を超えて、個人情報を取り扱ってはならない。
個人情報の利用目的を示し、かつ、示した目的を超える用途で使用する場合、あらかじめ本人の合意を得なければならない。ということか。
第二十六条 個人情報取扱事業者は、本人から、当該本人が識別される保有個人データの内容が事実でないという理由によって当該保有個人データの内容の訂正、追加又は削除(以下この条において「訂正等」という。)を求められた場合には、その内容の訂正等に関して他の法令の規定により特別の手続が定められている場合を除き、利用目的の達成に必要な範囲内において、遅滞なく必要な調査を行い、その結果に基づき、当該保有個人データの内容の訂正等を行わなければならない。
第二十七条 個人情報取扱事業者は、本人から、当該本人が識別される保有個人データが第十六条の規定に違反して取り扱われているという理由又は第十七条の規定に違反して取得されたものであるという理由によって、当該保有個人データの利用の停止又は消去(以下この条において「利用停止等」という。)を求められた場合であって、その求めに理由があることが判明したときは、違反を是正するために必要な限度で、遅滞なく、当該保有個人データの利用停止等を行わなければならない。ただし、当該保有個人データの利用停止等に多額の費用を要する場合その他の利用停止等を行うことが困難な場合であって、本人の権利利益を保護するため必要なこれに代わるべき措置をとるときは、この限りでない。
2 個人情報取扱事業者は、本人から、当該本人が識別される保有個人データが第二十三条第一項の規定に違反して第三者に提供されているという理由によって、当該保有個人データの第三者への提供の停止を求められた場合であって、その求めに理由があることが判明したときは、遅滞なく、当該保有個人データの第三者への提供を停止しなければならない。ただし、当該保有個人データの第三者への提供の停止に多額の費用を要する場合その他の第三者への提供を停止することが困難な場合であって、本人の権利利益を保護するため必要なこれに代わるべき措置をとるときは、この限りでない。
つまり、内容が事実と反するという理由以外では削除義務はないということか。
まず、「注文履歴は個人情報には当たるのか?」という問題だが、おそらく当たらないのではないかと思う。
では、目的が示されているかというと、
お客様から集めた情報は、パーソナライズによってAmazon.co.jp でのお買い物をよりよいものにし、Amazon.co.jpのほかAmazon.com, Inc.およびその子会社がインターネットを通じて提供する店舗、プラットフォーム、情報検索等のサービスをお客様にご利用いただくために役立てられます。Amazon.co.jpは、お客様の個人情報を、ご注文の処理、商品・サービスの配送、お支払いの処理、注文・商品・サービス・販売促進、お客様のご要望への対応、お取引記録の更新、およびお客様のアカウントの一般的なメンテナンスのためのお客様との連絡、ウィッシュリスト、カスタマーレビューなどの表示、お客様が興味をもたれると思われる商品・サービスのご案内などの目的のために利用いたします。また、お客様の個人情報は、Amazon.co.jpの店舗・プラットフォームをより使いやすいものにし、インターネットを通じ提供する情報検索等のより豊富なサービスをお客様が利用できるようにするほか、詐欺やウェブサイトの悪用を検知・防止するためにも利用されます。更に、第三者に業務委託して技術、ロジスティクスその他の機能を代行させる場合にも利用されることがあります。
http://www.amazon.co.jp/gp/help/customer/display.html?nodeId=643000#info
一応示されてはいる。これでいいのかという気はするが・・・。Internet Archive Wayback Machineには、2006年12月22日に最初に登録されている。
ちなみに個人情報保護法が施工されたのは2005年4月1日。ウィッシュリストが始まった時期については記憶にない。いつだっけ?
つまり削除義務はやはり無く、Amazonの対応は一応正当なものだと思われる
しかし、削除義務はないにしても、
第二十条 個人情報取扱事業者は、その取り扱う個人データの漏えい、滅失又はき損の防止その他の個人データの安全管理のために必要かつ適切な措置を講じなければならない。
これが守られていると言えるのだろうか。