はてなキーワード: ビッグデータとは
元記事が消えた時のために転載。
【PC遠隔操作事件】「真犯人」からのラストメッセージ(江川 紹子) - 個人 - Yahoo!ニュース
http://bylines.news.yahoo.co.jp/egawashoko/20130810-00027167/
■はじめに お疲れ様でした。 冬山はいかがでしたか? 私は紅葉のはじめの頃に行ったので快適でしたが、雪が積もった山は大変だったと思います。 さて、これまでメールにてさまざまな質問が寄せられました。 関連報道で謎とされている部分もあります。 それらについてFAQ形式でお答えしたいと思います。 ■なぜこうしたことをなさったのですか 警察・検察にどんな恨みがあったの?動機について詳しく教えて。 私もまた、間違った刑事司法システムの被害者です。 ある事件に巻き込まれたせいで、無実にもかかわらず人生の大幅な軌道修正をさせられた人間です。 それがどんな事件だったのかは詳しくは言えません。 サイバー関係ではありませんが、彼らが間違いを犯した原因の趣旨は、その事件も今度の事件も大して変わりは無いものです。 刑事司法の問題点として良く出てくるキーワード、「自白偏重」「代用監獄」「人質司法」「密室取調」「作文調書」...etc 私はそれらを実体験をもって知る人間です。 そして、そのとき私は負けてしまった。やってないのに認めてしまった。 起訴された。公判で「反省している」と発言した。 おかげで刑務所に行かずに済んだが、人生と精神に回復不能な大きな傷を残した。 一連の事件は、私が「負け犬」から復帰するためのリベンジと言えます。 『先に償いをさせられた人間はその分の犯罪を犯してもいい』という持論。 あなたは間違っている、たとえどんな理由があっても許されない、そういう突っ込みがあることを理解する程度の理性はあります。 でも、それが私だけの哲学であり、誰にも軌道修正されない行動原理です。 いつかのDigで誰かが「犯人は壊れている」と表現していました。 そう、壊れている。私を壊したのは奴らだから。 ■警察・検察をナメてるの? 慇懃無礼な文面から「ナメている」「グリコ森永事件みたいだ」などと言われてますが、そんなことはありません。逆です。 警察・検察の怖さは思い知っています。 どれほど怖いか、どれほどしつこいかを。 それを知っているからこそ、ここまで神経症・偏執狂とも言えるまでに厳重な注意を払って動いてきました。 ほとんどの人は、それだけの体験をしたなら、「もう警察には逆らってはいけないのだ」「目をつけられないようコソコソ生きよう」そういう卑屈な人生を送るのでしょう。 しかし私はその気持ちのベクトルが逆に働きました。 恐ろしい警察・検察に挑戦し、乗り越えることこそが私の人生に課せられた試練であり、それ無くしては一生負け犬として生きていくしかないと思いました。 ■自殺予告について。 ・ミス 「ミス」は嘘です。ごめんなさい。自殺する気は全く無かったです。 11月10日前後に、どこかの記事で「犯人が致命的なミスか?」「Torを使わず直接書き込んだ箇所」というのが載ったのがきっかけです。 決定的なミスで警察も期待しているかのような報道だったゆえ、ちょっと乗せられてみました。 結論を言うとその書き込みもTorです。 Torに割り当てられる出口ノードによっては2ch書き込み可能なところもあります。 たまたまそのとき書けるところに当たったので、わざわざシベリアの依頼スレを使わなかったというだけの話です。 結局何だったのかというと、一部メディアが言っていた「観測気球」という表現が半分合っていて、あとの半分は「面白半分」です。 ・新聞紙 「予告犯」という漫画を読んで、とても共感を覚えました。 特に、登場人物の犯人グループの一人である「ゲイツ」君の境遇には自分と重ね合わせできるものがありました。(11月に入ってからはじめて単行本で読んだので、このマンガに感化されて一連の事件を起こしたというわけではありません。念のため) その作品に出てきた、新聞紙を使う手口をちょっとだけ真似てみたというわけです。 ・写真の位置情報 恥ずかしいことに、これは本当にミスしました。 保土ヶ谷の適当な住宅地の緯度経度を入れたつもりが、10進数→60進数の変換を忘れてしまいました。 これは本当に私の無知であり、ラックの西本さんに「犯人は教養がない」と言われても仕方ありませんねw 結果的には、保土ヶ谷の団地が捜索され、意図どおりにはなりましたが。 ■決して死を選ばす、生きてすべての真実を明らかにしてください。 死を選ぶつもりはありませんが、自首することもありません。 もし仮に捕まったとして、私が白旗を掲げて自白したとしたなら、動機について「逆恨み」と表現されることでしょう。 「前科者が前に捕まったことを逆恨みしてまた犯罪を犯した」と、報道各社は警察発表そのままに垂れ流すでしょう。 私が前に経験した事件の判決が覆ることも無いでしょう。 もっと掘り下げてくれるほどマスメディアの皆さんのジャーナリズムを信用していません。 記者クラブで警察とベッタリなのは分かっているから。 「真実を明らかに」という点ではこのドキュメントだけでも十分なのではないですか? これだけ詳細に書いたなら、あと残りの謎なんて、私の住所氏名年齢程度の些細なことでしょう。 そんなことで事件の全容が変化するわけでもないです。 ■ご本人について・・・お名前、性別、年齢など可能な限り、ご本人様について教えてください。 ご想像にまかせます ■取材させてください できません。 このドキュメントを持って、私から発信すべきことはもうありません。 余談になります。基本的に面会取材は一切受けるつもりは無かったのですが、英国のBBCの方から取材依頼のメールが来たとき、ちょっとだけ気持ちが動きました。 以前見た「ポチの告白」という映画を思い出したのです。 警察腐敗、刑事司法の問題、記者クラブ制度の病巣、そういう部分を明らかにした、社会派な内容です。 登場人物が警察腐敗を暴こうとするも、記者クラブ制度に漬かった国内メディアには全く相手にされず、普段記者クラブから締め出されている海外メディアを頼るシーンが出てきます。 そのシーンを思い出し、BBCの取材依頼なら受けてもいいかな?と傾きましたが、やっぱり止めました。 そこまで出しゃばり屋でもないし、「凄腕ハッカー」のような扱いで出されても困る。(そこまで誇れる技術力があるつもりもない。) 「刑事司法の問題」という部分で言いたいことはいくらでもあるとは言え、私程度が言えることは誰かもっと頭のいい専門家が既に言っています。 だからわざわざ出る必要も無いと思い、他のメディアと同じようにBBCのメールも無視しました。 落合洋司先生がBBCの取材を受けていたようなので、それで私が言いたいこと、世界に向けて言うべきことは言ってくれたと思います。多分。 ■どんなことを考えていますか?世間の反応についてどう思いますか? 警察が誤認逮捕をやらかす、世間が騒ぐ、という意図どおりの結果になったとは言え、反響が予想以上に大きく戸惑っています。 同時に達成感も大きいものとなっています。 正直なところ、もともと犯行動機は私怨が主で、あまり政治的自己主張は考えていませんでした。 警察・検察・世間が騒いであたふたしたら嬉しいな、自分の溜飲が下がる、それだけでした。 「刑事司法の矛盾を暴く」というような高尚な目的意識も高くはありませんでした。 また、神保哲生さんが、「ダウンロード刑罰化・ACTA・サイバー犯罪条約・児童ポルノ単純所持処罰などのネット規制の動向に抗議する意図も犯人にはあったのではないか?」のように分析していましたが、そのあたりについても全く考えていませんでした。 それらについては、事後に専門家のコメントを見て深く考えるようになりました。 もともとネット規制は私もどちらかというと大反対です。 刑事司法の諸問題、ネット規制に関する諸問題、どちらについても国民の自由が奪われる方向に向かっていくことは防がないといけないと思っています。 後付けの動機となってしまいますが、今となって思えば、自分の行為がその一助になれたら本望です。 (もっともネット規制のほうは私のせいで逆に締め付けが強くなりそうですが) 余談です。 家電量販店のウイルス対策ソフトのコーナーでは、「遠隔操作ウイルスの脅威」のように煽るPOPを付けて売っていますね。 私はそういうところに立ち寄り、一連の事件の社会的影響を確認したりしています。 売り場に立っているソフトメーカーの販促スタッフに、ぱそこんしょしんしゃの振りをして神妙な顔で、「最近ニュースで話題の遠隔操作ウイルスがすっごく不安なんです(>_<)」のように話しかけてみました。 すると「この製品が一番最初にiesysに対応したんですよ!」と、とても嬉しそうにアピールされました。 何だかおかしかったです。 今まさに目の前に真犯人がいるとはこの人は微塵も思ってないんだろうな・・・と内心考えながら、説明をしっかり聞いてあげました。 ■目的通りに誤認逮捕を招き、警察・検察が謝罪しているが、今どのように感じているか 警察官や検察官はもっと人並みに、人の話をちゃんと聞く姿勢があれば1件も誤認逮捕など起こさなかったのでは?と。 あの人たちはコミュニケーション能力以前の問題、日本語というか地球語が通じない宇宙人です。 彼らにそういう能力が無いことを分かっていて試した私も私ですが。 結合試験のテストパターンを作って流したら再現性のあるバグの結果が得られた、そんな感想です。 テスト結果を全国に、全世界に提示できたことは大変有意義だと思います。 ■警察の技術レベルについてどう思われたか CSRFについては見破られると思っていました。 後述のようにいろいろ工夫したとは言え、「2秒で送信」問題は消せなかったので。 私の知っている警察のしつこさは、被疑者をシロにする方向には働かなかったのだなと再確認。 iesysについては見つけられなくても仕方が無いです。 投入前に、主要なウイルス対策ソフトの体験版をいくつか試用し、検知に引っかからないことを確認しました。 完全自作プログラムだったので定義ファイルにパターンマッチすることは無いですが、ヒューリスティック検知に引っかかるかも?と興味を持ちテストしました。 特にキーロガー機能でOSのキーボード・マウス入力命令をフックしているあたり、「怪しいプログラム」アラートぐらい出てもおかしくないと推測。 結果的にはどの製品でも引っかかることはありませんでした。 あの手の「ヒューリスティック検知搭載」と謳って売っている製品が、それをどのような基準で行っているのか興味深いところですね。 警察の技術レベルが高いか低いかですが、今回の失態の趣旨は、デジタルとは関係ない部分での捜査手法の欠陥のほうが、原因の多くを占めていると思います。 技術レベルは高いところもあれば低いところもあるのでしょう。少なくともサイバー課をナメてはいないし油断してもいません。 140人の捜査体制だ、FBIに協力要請だ、そういうのを見て正直プレッシャーを感じてもいます。 最近の動向として、「犯人がアクセスした可能性のある90億ログを解析している」という。 これについては、直接関連するサイトへのアクセスは下見閲覧段階も含めて完全にTorを使っています。 たとえば横浜市のサイトやJALのサイトなど、一度も生IPでアクセスしたことはありません。 この時点で9割5分、捜査線上に挙がることすら無いと思っています。 しかし全てのアクセスでTorを使ったわけではない。 間接的に関連するようなサイトは、普通に閲覧したところもあります。 ビッグデータ解析のようなことをして、「こいつはこのサイトとこのサイトを見ているので怪しい」という、 100人か200人かの「犯人候補」の中に絞り込まれることも無いとは言えないです。 全国津々浦々、それら犯人候補のところに一人ずつ家庭訪問すれば、どこかで私に突き当たるかもしれない。 その可能性も予測しているため、油断は一切していません。 前に述べたようなオンラインでのアクティビティだけではなく、自分しか触らないローカルPCの中身までも偏執的なまでに注意を払っています。 つまり、私のPCを調べたところで証拠は何も出ません。他の100人200人の犯人候補者と同様に。 犯行に使った罠Javascriptやトロイのソースファイルそのものから、細かいメモに至るまで、ファイルを置く場所については厳重に管理していました。 そしてそれらが存在した記憶媒体、およびそれらを開いたことのあるシステムの記憶媒体は全部、とっくに完全消去の後、スクラップにして燃えないゴミに出してしまいました。 現在うちにあるシステムや外部記憶媒体全部、どんな高度な復元やフォレンジックを行おうと関係ありそうなものは何も出ません。 令状なしで来ても「どうぞどうぞ」と見せてあげますよ。 エロ画像の10枚や20枚は普通にあるので、それだけ鑑賞してお帰り下さい(笑) それとも、犯人候補の中からあてずっぽうに選んでお得意の自白強要しますか? 「真犯人」を追求したつもりが、「新犯人」を作ることにならないといいですね。 私は根っからのカタギであり、ヤクザや過激派セクトの人のような海千山千な犯罪者ではないですが、経験者であるだけに、否認なり黙秘なり適切に対応する自信はありますよ。 「テメエコノヤロウ」とか、「お前の関係先にガサ入ってガチャガチャにしてやるからな!」(原文ママ)とか同じようなセリフを言われても今度は負けませんよ。 ■一体、このゲームをどこまで続けるおつもりですか?どのように決着をつけるつもりでしょうか。 もうやめます。 私の気が済むまでやって捕まらなければ勝利、という条件を設定していましたが、ここまで反響が大きいと、私の溜飲は下がりました。もう負け犬ではないです。 私が巻き込まれた事件のことも、私が起こした事件のことも、全部忘れて再出発します。 ■誤認逮捕された4人の男性への謝罪の気持ちはありませんか。 こうでもしないと警察・検察を自省させることはできなかった、仕方の無いこととは言え、大変申し訳ないと思っています。無関係の4人を巻き込んだこと、軽く考えてはいません。 自分は悪くないなどと言う気はないです。償わなければならない罪を犯したことは分かっています。 でもそれ相当の罰は先に受けている。だからこれ以上責任を負うつもりはないです。 罪と罰の因果の逆転。そういうことが起こっていることを分かってください。 ■横浜事件 ・●●小学校 横浜市サイトに脆弱性があったのを見つけたので、横浜市の小学校一覧から無作為に選んだだけです。 ・「鬼殺銃蔵」の意味 「餓鬼殺し」を省略して「鬼殺」。また、日本酒の商品名とかけたというのも合ってます。 殺し屋であるゴルゴ13、「こち亀」に登場したパロディキャラ「後流悟十三」、あと昔読んだ「隣人13号」の主人公の「村崎十三」、そのあたりのキャラクターをイメージし、「じゅうぞう」という読みに決め、「銃蔵」と当て字にして完成。 それほど深く考えて決めたわけでもない、30秒ぐらいで決めた名前です。 ・本文 猟銃で射殺していく内容は、春ごろに読んだ小説「悪の教典」を参考にしました。 ・CSRFについて補足説明 CSRFの仕組み自体はオーソドックスだったのですが、ちょっと工夫を入れました。 1)犠牲者は最初の一人のみに絞った 不特定多数が見る掲示板に貼るという性質上、複数の人が踏むのは当然。 そして複数の人から一字一句違わない脅迫文言が届いたら、どんなに警察がお馬鹿でも何らかの仕掛けを疑うでしょう。 サーバ側のPHPで制御することで、最初に踏んだ一人にのみ有害CSRFが発動し、2人目以降は無害なリダイレクトが発生するだけという仕組みになっていました。 2)キャッシュで罠スクリプトを発見されない工夫 A「直接踏ませるスクリプト。BをJSONPでクロスドメイン読み込みして実行する」 B「CSRFを行う有害スクリプト。Aとは別サイトに設置。」 の2部構成。 Bの側に、1)で書いた制御を入れました。 そして、Aでは、 「Bを読み込んで変数に格納(B1)→Bを再度読み込む(B2)→B1を実行」 というフローで動作します。Bを2回読み込むというのが肝心です。1)の制御により、B1はCSRF、B2は無害スクリプトになります。 永続性記憶装置に保存されるブラウザのキャッシュには、B1はB2に上書きされ、B2だけが残ります。 変数に格納されただけのB1は実行後、DRAMから揮発してしまいます。 ただし再読み込み時、キャッシュ再利用の挙動はブラウザごとに異なります。 IE等では、2回目の読み込みは発生せず、キャッシュから拾ってきてしまいます。(2回目もB1になる。) URLの語尾にgetクエリでユニーク文字列を付加するというのがキャッシュリサイクル対策の常套手段ですが、 これをするとどのブラウザでも全く別のURLとして扱われ、キャッシュも個別に残ってしまうのです。 解決方法が思い浮かばなかったので、Aの時点でダメブラウザは入り口で弾くようにしておきました。 3)エスケープ 一応気休めで、文言も含めたスクリプト全体を、encodeURI()関数でエスケープしてありました。 仮に有害スクリプトのキャッシュが残ってしまっていたとしても、発見しづらくなる効果を狙いました。 その時刻付近のブラウザキャッシュに対し、脅迫文言の一部で機械的にgrep検索をかけたとしても、罠Javascriptの構文は引っかからないはずです。 もっとも2)がちゃんと機能していれば別に平文のままでも良かったのですが。一応念のためにという感じ。 4)iFrameにより関連サイト4~5箇所次々と読み込む 単に文言を送信させるだけなら、所定CGIにリクエストパラメータ付きでPOSTする仕組みで良かったのですが、 それだけではなく、「犯人性を高める」工作を入れました。 明大生のPCに小学校のサイト等へのアクセス記録があったというのはこれのことです。 「小学校のサイト」「横浜市トップページ」「入力フォームのページ」などを読み込ませることで、あたかも自分でアクセスしたようなブラウザログ・キャッシュが出来るのを狙ってのことです。 何の前触れも無くいきなりCGIだけを触った痕跡しかなかったとしたら、警察の捜査員が見ればどう考えても何らかの仕掛けを疑うと思ったため。 もっとも、開かれている数秒のあいだに全て終了させた以上、「2秒で250文字を送信」という不自然さは消せないわけですが。 数分のあいだ開かせ続けられるような魅力的コンテンツを用意できれば、時系列的にもっと自然な形で文言の送信ができたのですが。 まぁ面倒だったので、時間的不自然があることは把握しつつ、うまく行くかどうかはダメ元でのチャレンジでした。 警察がお馬鹿だったので見事に嵌ってくれたわけですが。 ・「告白文」のゆくえ 上記のように、CSRFスクリプトをこれだけ工夫しすぎたせいで、ちょっと動作の不具合があったみたいです。 後で試したら、大丈夫だと思っていたブラウザでもうまくいかないことがあったり。 おそらく「告白文」のほうは、踏んだ人の環境では正常動作しなかったのだと思います。 逮捕2日目でネタバラシしたつもりが、発覚まで3カ月以上も費やさせてしまったことについて遺憾の意を表したいです。 7月初旬のあの時期、告白文は届いていたと思っていたのに「誤認逮捕」報道が無いことについて、警察が完全に黙殺したか、釈放はしたものの明大生に因果を含めて騒がないようにしたか、記者クラブでベッタリのマスコミに因果を含めて黙殺させたか、そっちの可能性で考えてしまっていました。 ■CSRFとオリジナル遠隔操作ウイルスを作成しているが、途中切り替えたのはなぜか CSRFでは、脆弱性のあるサイトにしか通用しないです。 それを探し出すのもまた手間なので。 もっとどんなサイトでも適用できる汎用性のある手段をと考えて、iesys.exeを設計しました。 ■大阪 ●●●氏へのお詫びに●●●のBDを全巻買いました。 今まで見たこと無かった作品でしたが、ファンになってしまいました。 新作映画も見に行きたいと思います。 ■福岡 遠隔操作先PCオーナーは福岡の人だったと分かり、福岡ドームとか太宰府天満宮とかを脅迫する文言を書きかけたのですが、気が変わりました。 警視庁の方たちに、遠路はるばる福岡までガサ入れしに行かせてあげるのも一興かなと思い、わざと東京のターゲットにしました。 単純に警察に対する嫌がらせです。 (せっかくだから稚内とか利尻島とかも思いついたんですが、さすがに僻地すぎて無視されるだろうな・・・と思ってやめました。) ■三重-「わざと消さなかった」は虚偽では? 最初の感染確認後すぐ遠隔操作で2chに伊勢神宮脅迫書き込みを行い、その後しばらくPCの中身を物色していたのですが、 iesysのキープアライブ通信が途絶え、オフラインになってしまいました。 単にオーナーが電源オフにしたのかと思い、自分でプロセス停止をしたことまでは分かりませんでしたが。 したらばのスレッドにsuicaコマンドさえ書き込んでおけば、次にオンラインになったときに勝手に消える仕組みですが、このときはそれはしませんでした。 このPCが捜索された際、ひょっとしたら警察の捜査の実行画面が見られるかも?という好奇心が沸いたので。 夏からやっている連続犯行予告にもそろそろ飽きてきていて次の展開に行くタイミングを計っていたこともあり、 iesysを発見されたらそれはそれでいいかなという気持ちでした。 結果的にはその後一度もオンラインにならず、観察を続けることはできなかったのですが。 いずれはどこかで発見されるよう仕向け、また告白文でネタバラシするつもりだったというのも本当です。 何より誤認逮捕が明らかにならなければ、本当の攻撃対象である警察・検察に何のダメージも与えられないのですから。 ■安部総裁殺害予告もやったのか? 私ではありません。 模倣犯?ということもちょっとだけ頭をかすめましたが、 10月上旬という時期から、模倣犯とするには時系列的な矛盾があります。 「遠隔操作」が言われ始めたのが10月7日ぐらいですが、安部さん殺害予告はそれより前からあったようなので、私の事件に触発されたという線は無いでしょう。 報道によると発信元とされるオーナーは否認しているとのこと。 私がやったのと類似の何らかの仕掛けによるものなのか何なのか、私にも分かりません。 ■黒子のバスケ脅迫は 知りません 関係ないです ■「犯人像」についてコメント メディアに出てくる「専門家」の方々が、各自好き勝手に犯人像を語るのはとても面白かったです。 的外れなのもあり、当たってるのもあり、いい感じにバラけていると感じています。 そもそもこれまでの行動・言動は、プロファイリングの面で犯人像を絞り込ませないための工夫を入れています。 ・C#を使うような若者かもしれないし、「はだしのゲン」に思い入れのある中年かもしれない。 ・皇室や神社を攻撃するような反日左翼かもしれないし、部落開放同盟を攻撃するような右翼かもしれない。 ・アニメフィギュアのコレクターなのかもしれないし、まったく興味が無いのかもしれない。 ・「また来世~」などと、伊集院光のラジオのファンかもしれないし、そういうフリをしているだけなのかもしれない。 ・将棋が好きなのかもしれないし、そうでないのかもしれない。 ・引きこもりなのかもしれないし、アウトドア派なのかもしれない。 挙げればキリが無いけれど、こういう気まぐれで無軌道な動きはわざとやっています。 引き出しが多いほうだと人から言われるほうですが、私の引き出しにあるものも、全くの守備範囲外のものも、程よくミックスして出しているわけです。 このドキュメントでまた材料が増えたわけですが、この段階で今度は「専門家」の方たちがどうプロファイリングするのか、かなり興味深いですね。 ■捜査特別報奨金制度の対象となったことへのコメント >犯人に関する情報について >~この犯人を知っている >~事件について噂話を聞いた >このメールを送信した者を知っている 身近な人だろうと誰にも喋っていません。 このような情報は全宇宙の誰からも得られません。 >これらの言葉遣いや言い回しを使う者を知っている >同じような表現を用いて文章を書く人を知っている 一般社会ではきわめて常識人ですので、それらのようなキチガイ文書を書くことはありません。 よって、私に関する情報は全宇宙の誰からも得られません。 >このような特徴を持つウイルスを過去に作成した人や団体を知っている。 >このウイルスを作成した者を知っている。 お話になりませんね(笑) ■片桐裕様へ たしか就任直後から「2ch潰す」とか「ネット規制する」とかいろいろ言ってますね。 そんなに言論統制が好きなら、あなたは日本人やめて中国の小役人にでもなったほうがいいのではないですか? あなたの大好きな検閲・規制・弾圧がいっぱいでまさに理想の国ですね。誤認逮捕しても怒られないでしょう。 というわけで、貴様は今後発言するときは語尾に「アル」を付けて喋ること。(命令) ■改めて世の中に言いたいことは 私のように警察・検察・裁判所に対して悔しい思いをされた方は多数いると思います。 上訴、再審請求、国賠請求、あるいはデモや街宣、出版、主張サイト開設、そういった法を侵さない正攻法の戦い方もいいですが、勝ち目は無い場合が多いです。 法が間違っているのなら、法を侵してでもどんどん逆襲すべきです。 国家権力という途方も無い相手と戦うのに、コソコソ隠れるゲリラ戦術を選択するのは卑怯でも何でもないことです。 戦うべき人が戦えば国は良い方向に向かう、そう信じています。 ■最後に 私からは以上です。もう何も発信しません。 ●●●@●●のメールアドレスはもう解約しましたので、メールをもらっても受け取れません。 最後まで読んでくれてありがとうございました。 さようなら。 (固有名詞などは一部●●で伏せててあります)
以前成形肉を批判する記事がBIZ誠に載っていたと思う。(確か時事通信出身の相場英雄氏の記事)
この筆者は「成形肉はマズイ」という前提で記事を組み立てていたと思うが、私見だが、
「クックパッド」の登場で、伝統的料理や高い料理(例:普通の肉)と新料理や安い料理(例:成形肉)の食味格差は、
急速に格差縮小、ないし逆転していくと思う。
昔なら、食味向上のノウハウは、個々が分散保有していて、共有化されなかった。
フォルクスはフォルクスで黙々と成形肉食味向上に取り組み、ロイホはロイホで黙々と取り組む。
家庭料理の食味向上も、それぞれの家庭(主婦)の孤独作業に委ねられる。
と言うか、食味向上は面倒くさいから、主婦は自分が知ってるレシピを墨守する。いわゆる「お袋の味」
⇒クックパッドの登場で、無数の「素人」「ボランティア」が料理の食味向上に、無給で取り組むようになった。
その気になれば食味向上のスピードが加速的に、指数関数的にスピードアップする
「数万人が試作レシピにチャレンジし、数万人が試食し、数万人がコメントするプラットフォーム」を、
外食産業が積極活用しない手はない。自社の、せいぜいスタッフ数が数人の新レシピチームに新レシピ開発委ねるより強力では?
要するに、クックパッドの人気メニュー、或いはクックパッド内で人気はないが美味しい料理を、
外食産業が新メニューとしてデビューさせればいい、という提案である。
(こういう場合、「著作権」が成立するのかどうか、知らないが)
逆に言えば、クックパッドにアップロードされた膨大なメニューは、日の目を見ずに埋もれている状態。
一種のビッグデータ状態と化しているが、これを外食産業が「掘り起こし」すればいいのでは?
ところでいつも思うが、クックパッドって、そもそも海外にあるのかな?
「今日の晩ご飯、献立何にしよう?」と思い悩むのは、日本の主婦だけなので、クックパッドの類のサービスは海外では成立しない、と言う話もある
余談だが、「ミールソリューション」と言う単語が食品スーパー業界にあるが、その中身は日本とアメリカで違う。
状況として、GoogleやFacebookが現実に膨大なデータを抱えていること、
新しい潮流が生まれていることは間違いない。
それがバズワードとして機能しているという背景自体に注目する必要がある。
なんでもいいけど、それ求めたから何なの?
うわ、ただの馬鹿だった…。
統計学について少しくらいは知識があって言ってるのかと思ってたら何も知らないだけかよ…。
少しでも勉強する気あるなら、
http://www.amazon.co.jp/dp/4130420658/
http://www.amazon.co.jp/dp/4274131491/
http://www.amazon.co.jp/dp/400006973X/
簡単な本としてこの辺くらいは読んでから口開くといいんじゃないかな。
「ビッグデータ最強!!!!!統計学で勝つる!!!!!!!!!11111」みたいな感じの頭悪そうな本は読まなくていい(日経ビジネスと踊る系の人だったら好きにしてくれ)。
http://anond.hatelabo.jp/20130716112155
http://anond.hatelabo.jp/20130716112141
と言う物自体は、これまでは、大量のデータ、を得る事自体が無理なので
サンプルを選んでそこから意味を得る、的な事をやっていたのに対し(その際処理能力はどうでもいい)、
これからはサンプルがしょぼしょぼコンピューターじゃ処理できないくらいになってきたから
沢山リソース使うよ~、とか、これまでは無駄に使ってきたリソースをちゃんと考えて使うよ~、ってことか。
やっぱり今まで何も考えずにバカみたいな事してたのを、まじめにやります、と言ってるようにしか見えないけどな。
実際、必要なところでは常に昔から直面して、努力して解決なり最善を尽くしてきてる部分の話だろ。
"クラウド"もそうだけど、言葉が出てきた時、どんな新しいことなのか
全く理解できなかったけど、今にして思えばすでに当たり前になってる話を、良く分かってない人達が
騒いでるだけに過ぎなかった、と言うのがよく分かったし。(当たり前の事過ぎて"新しい技術だ!"と騒がれてる事がその程度だと思わなかった。)
なんでもいいけど、それ求めたから何なの?
ビッグデータはインフラ技術であって、別に統計学的に新しいもんなんてねーよ。常識だろ。
せいぜいSGDとかのオンラインアルゴリズムが発展したくらいだな。それも別にビッグデータのせいってわけでもねーけど。
ビッグデータがこれまでの統計と違うのは、データがデカすぎてこれまでの方法では計算が終わらんのですよ。そのためたくさんのコンピュータでの並列処理とかアルゴリズムが工夫されてて、その部分が新しい。1行で書くとこんな感じ。
最近「クラウド」、の次に出てきた「ビッグデータ」と言う単語だが、
なんでこれがもてはやされてるのかが分からない。
色々見てみても、つまりは得られたデータがあり、そのデータを解析してみました、と言うだけにすぎない。
物凄いbreakthroughがあったような印象を受けるが、見てみれば何のことはない、単に得られるデータが大きくなっただけ、としか見えない。
(この辺自分の知識が足りないだけかもしれない)
むしろ、データが少ない時はまじめに考えないとそこから何も抽出出来なかったが、
データが増えたんだから適当にやっても色々分かるよ!、と言っている様にしか聞こえない。
風が吹けば桶屋が儲かるみたいなことが見つかるよ!的な事を言ってる記事もよく見る。
データ量が大きくなろうが少なかろうが、そのデータがどれだけバイアスがかかっているもので、
その量から得られる結果の誤差がどれくらいなのか、と言うことが大事のあのであって、
量が多ければその統計誤差が減る、というだけの話。ただそれ以上の系統誤差があるならば無駄にデータ量を増やしても無駄。
だから得ようとしてる結果が統計誤差が主でどうしようもない状態、と言う場合でなければ意味が無い。
ただ、Yahooの選挙に関するビッグデータ解析みたいな話もあったが、その辺どこまで正確にやっているかも分からないし、
これまでの選択的なサンプルに比べてどれだけ正確なのかも分からない。
ただただサンプル数が増えてそれぞれにおける情報量も増えたので適当な相関関係を調べてみました、というだけ。
別にそれは新しい視点、と言う意味で別に良い。だけど、それは今までの調査に比べてどれだけ正確でどれだけメリットがあるのかが全く不明。
はっきり言ってその辺1000人に聞きました、と統計的にどれだけ優位性があるのかが全く分からない。
(もしかしたら数値全部公開してて見れば分かるのかもしれないけど)
ビッグデータ解析によってデータアナリストの数が足りない、とか言っているが、
要するにこれまでまともな市場調査等を一切してこなかった、ということでいいのだろうか?
社内でのネットワークセキュリティとかコンプライアンスの話では無いよ。
スイカの件もそうだけど仕事でセキュリティに携わっている奴は過剰反応すぎる傾向がある。
なにかと個人情報保護法を持ちだして、自分の中の完璧なセキュリティじゃないと急に叩き始める。個人情報保護法を拡大解釈してる。
それに追随してちょっとかじっただけの門外漢(以下、お前ら)が一斉に叩き始める。
大事な個人情報もあるだろうが、個人特定して詐欺したいわけじゃないから。
もうお前らみたいのはPCオフラインにして月一くらいで顔面整形して外出るなよといいたけど、現実それは無理な話。
お前らの周辺情報なんかとっくの昔から人海戦術で集められてんだよ。
不動産関係やら出店前調査やら金借りるときの信用情報やら、大げさにいったら交通量調査だってそうだろ。
情報がないとその地域にインフラを含めた適切な設備、物資が揃わない。揃えづらい。わかるだろそのくらい。
ちょっと前に渋谷駅改修で不便になって、ヒトの流れ調査やってたなそういえば。
セキュリティ界隈は腐敗してる。
自分たちの利益確保のためなのは多少理解できる。仕事だからな。生活もあるし。
新サービスにありえないポスト送ったり(まぁこれはサービス側もあれだが)
どこの誰が書いたか分からない文献を一部だけ引っ張り出してきて叩いてどや顔したり
ビッグデータの件のようにいままで人海戦術でやってた部分をITに置き換えただけで何騒いでんだよ。
ITリテラシーって過剰になることじゃないでしょ。
「企業が利益のために個人を特定してる!」と勘違いしてる奴も多いだろう。
しねーよ。お前個人を特定しても利益になんねーから。コスト考えろよ。
「同意してない!」とか言い始めるだろうけど「だったら使うなよ」と同じレベルの反論だぞ。
スタンプ式の紙のポイントカードも捨てろ。あれもお前らのいう個人情報になりうるぞ。
http://anond.hatelabo.jp/20130630004408
http://anond.hatelabo.jp/20130630035133
SUICAの情報とられたところで、おれは、ぶっちゃけぜんぜんかまわないけどさ、
ただ、それとは別に、
個人情報どこまで無断で抜いていいかどうかについては、歯止めをかける線引きは必要だろうとは思ってるよ。
だから、その線引き(個人情報保護法)を無視するアクションをみんながゴリゴリやると、
やめましょーねと、と。
で、いまのところビッグデータやらなんやらが、問題になりはじめたこと事態があたらしいことだから、
社会的合意も、社会的な問題認識のリテラシーレベルも追いついてないから、
「このぐらいまでだったら、ぶっちゃけ、無断でやってくれてオッケーよ」
「これは結構やることがえぐいので、オプトインでお願いします」
「これは、「agree」ボタンどころじゃなくて、かなり個人情報取りまくりんぐなので、
とかっていうことの、範疇について、しっかり、議論してきましょーねって話だよね。
個人的には、日立さんに、マーケティングデータとして、SUICAの情報をとられてもいいけど、
「それは困る」っていう人が、いるのはわかる。
何よりも日立さんの担当者のリテラシーが低い可能性はじゅうぶんあるわけで、
結果として、検索すると、私のハンドルネームが完全にネット上にオープンに検索されちゃう可能性とか、
まあ、起こりうるからねぇ。(ってか、そういう事件、ここ数年で起こりすぎだからなぁ)
ほんとに、マーケッティングのデータとしてとられるだけってことが確証がある状況ならさておき、
日立の担当者のリテラシーレベルがわからないから、こわいんだよね。こういうの。
おれ、けっこう、いろいろな人からアポをとりたがられている身分なので、
「増田さん、あの時遠くにいるから無理って言ってたけど、同じ駅にいたじゃん!」
とか、ちっちゃい嘘がばれまくっちゃう可能性とかは回避したいよね。
そういう話なんじゃないのか。
Suicaの利用履歴を分析したものを商用利用するって話について、賛否両論になっているけど、私はこれは非難して当然の話だと思う。
その理由は、プライバシーとかではなく、これが集中と選択のために利用されるという点そのものだ。結論から言うと、公式なビッグデータの提供は、特定箇所での過剰競争と、利用者全体でみたときの生活の質の低下を招く。
もちろん、企業の利益を最大化するために集中と選択が重要だというのは間違っていない。だが、いくら昨今注目されている手法を使ったところで、データによる集中対象の選定というのは、分かりきった結論の補強にしかならない(プラス、一面的で近視眼的でもある)ことが多い。
それ自体はよく知られたことだが、わざわざお金を出して買う以上、それを重視した行動をとらないと損だと考えてしまうだろう。
結果、データを購入した企業は、必要以上に人口密集地や定番商品への傾倒を深めてしまう。(しかもJRそのものからの「公式」情報なのでブレがなく、各社同じ結論を出してしまう)
そうなると集中された部分で過当競争を生み、除外した部分で不足を生む。販売されるのはSuica情報なので、地域格差に特に悪影響があるだろう。
今まで人口密集地でなくても生活に問題ない程度には便利だったところが、提供サービスの減少によって困難を覚えることの多い場所になり、逆に密集地では過剰なまでのサービスの提供が行われるようになる。
利用者が単に消費者であるのならプラマイで大して問題ないと思うかもしれないが、利用者は少なくない割合で勤労者でもあるので、その場合は「公式」情報による「最新で最高の」見込み売り上げに基づく販売目標、を達成すべく重点市場をターゲットに労働することになる。
しかし、同じデータをもとに参入した競合が多数いる状況なので、当然目標は達成できない。畢竟、ストレスフルナ職場で勤務するという状況を強いられる。(その一方で赤字にならない程度の採算でまったりやっていた職場というものは姿を消すことになる)
勤労者にとってはただ迷惑な話だし、企業にとってみたって、結局ビッグデータなんていうのは、競合を出し抜かないと価値はないのだ。
では、せっかく蓄積されつつある電子データなのに秘匿しておくべきなのか、というとそれも違う。
競争と隔絶した単一者、公共セクターの活動を評価・改善するために積極利用するべきものだろう。
公共施設の料金支払いをSuicaでできるようにしたり免許証見せるようなときに任意で一緒に押してもらったりして、交通網との関連を調べたり、新規に計画を立てるときの効果予測のために活用すべきだ。
(若干バイアスがかかってしまうのが問題ではあるが、現在の公共事業の利用予測はこれ以下がないぐらいずさんなので悪化はしないだろう。)
だけどこういう系は図書館ではやらない方がいいような気がする。なんとなくだけどそう思う。
こちらからは以上です。
マジレスすると荻野久作って方が何十年も前に統計学的に研究して結論出してるんだが。
つーか、"統計学"的な推論は元々母集団が少なくても、有意差を検知するために開発されたんであって
排卵と妊娠の関係みたいな、母集団がほんとに綺麗な正規分布を描きそうなものにビッグデータはぶっちゃけいらんね。
「国営ルナルナ構想」がもし実現して、かつ女性たちが、
「国営ルナルナに正直に申告」したとすれば、
「女性周期と妊娠についての、ビッグデータ」が纏まっていたのでは?
「排卵日に●●をやったら、妊娠する確率が高い『だろう』」と推論しているが、
「排卵日2日前」なのか、
「排卵日1日前」なのか、
「排卵日」なのか、
「排卵日1日後」なのか、科学的に、或いは統計学的には解明されていない。
あるいは、
「数日置いて●●する方が、かえって『濃く』なって、妊娠確率が高まる」のか、
なので、日本の妙齢女性2,000万人のビッグデータで以って、
工学系の院でドクターをやったが,挫折して企業に就職した。大手小売り系の会社で「ビッグデータ」(笑)の分析をやっているが,いろいろと不満である。
第1に,社内での過去の分析の蓄積がない。分析は,会議などの意思決定の場にあわせて実施されるが,その場限りのものである。過去の分析結果が参照されることはない。自分が過去におこなわれた分析結果を参照しようにも,その方法が実質上ない。
第2に,それゆえ,分析は散発的におこなわれ,恣意的に活用される。自分の分析スキルが(運良く)社内の実力者に目に留まったとする。彼はこう言う。「今度の経営会議で,このような主張をしたいのだが,そのために,このようなデータは作れるだろうか?」。彼が望むデータを得る事ができれば,私の分析結果は,晴れて経営会議でトップマネージメントに披露される。そして,私は,次回の経営会議でも,彼に分析を依頼されるであろう。しかし,仮に私の分析結果が彼の望むものでなかった場合は,どうなるか。彼に対立する立場のものに引用されるのならばよい。私のデータが社内で論争を引き起こし,そして,社内の意思決定を正しい方向にみちびく事になるからだ。しかし,そうはならない。私のデータは単に黙殺される。私は自分自身の昇進のことを考え,自分のデータを,彼に都合の良いものにどの程度加工するか(ひどい場合は捏造するか)判断を迫られる事になる。
第3に,1と2のような状況にもとづいた過去の「分析」に対する不信感により,社内で分析に対する信頼感がひどく低い。売り上げ・利益・在庫といったソリッドな数字はKPIとして共有されているが,それ以外の数値は無視される。外部コンサルを含めた分析者は,実力者におもねる茶坊主として軽視され,出世をするのは,営業で目立った数字を上げた者ばかりである。分析にひつような,情報の共有に必要な投資はなされない(1につながる)。図書館などない。白書や外部のシンクタンクが発行したデータの購入もままならない。そのような状況においては,毅然として,自分の信じる分析をおこない続けるのも困難である。
小選挙区の死票半端ない 自民2500万票222議席 民主1100万票38議席 共産700万票1議席©2ch.net
小選挙区制の魅力 有権者2割の投票で8割が自民党議席に©2ch.net
今回総選挙の自民党の絶対得票率は、比例代表選挙で16・99%、 小選挙区で24・49%に過ぎない!
一選挙区から一人しか当選しない小選挙区制を採用している場合には、特定の政党に投票する傾向の強い地区を分割し、相対的に多数が別の政党に投票する傾向のある選挙区に吸収させることで、特定の投票を無効化することができる。
共和党のジョージ・W・ブッシュが、民主党の現職副大統領アル・ゴアを破って当選した。
獲得選挙人 271
得票数 5045万人
得票率 47.9%
獲得選挙人 266
得票数 5099万人
得票率 48.4%
Amazon.co.jp: 選挙のパラドクス―なぜあの人が選ばれるのか?: ウィリアム パウンドストーン, 篠儀直子: 本
「合理的無知=コストパフォーマンス的に、政治の勉強に膨大な時間を費やすより、適当に暮らしてた方が合理的。」
ビッグデータがバズワードになって久しいけど、情報がある程度集まったら匿名性(引いては個人のプライバシー)なんて保つのは不可能じゃないの?という記事から、未来予想さえ可能になるかもよという論文の紹介。
The greater the amount of personal data that becomes available, the more informative the data gets. In fact, with enough data, it's even possible to discover information about a person's future. Last year Adam Sadilek, a University of Rochester researcher, and John Krumm, an engineer at Microsoft's research lab, showed they could predict a person's approximate location up to 80 weeks into the future, at an accuracy of above 80 percent. To get there, the pair mined what they described as a "massive data set" collecting 32,000 days of GPS readings taken from 307 people and 396 vehicles.
利用可能な個人情報がより増えたら、データはより情報価値が上がる。それどころか、十分なデータ量があれば人の未来に関する情報を発見することさえ可能になる。昨年、英ロチェスター大学の研究者であるAdam Sadilek氏とMicrosoftリサーチラボのエンジニアであるJohn Krumm氏は80週先の人のおおよその居場所を80%の正確さで予測可能であることを発表した。研究を行うために、二人は*莫大なデータセット*と彼らがいうことろのものに注意を払い、307人と396台の乗り物から収集した32000日のGPS記録を収集した。
論文:
http://www.cs.rochester.edu/~sadilek/publications/Sadilek-Krumm_Far-Out_AAAI-12.pdf
"Has Big Data Made Anonymity Impossible?"
http://m.technologyreview.com/news/514351/has-big-data-made-anonymity-impossible/より抜粋
ファーストリテイリングの会長のインタビュー記事をよんだ。
時代はグローバル化だ、そうだ。そもそもグローバル化ってなんだろう。辞書的な意味は、国家なんかの垣根をこえて自由に経済しましょう、ということだろう。境界の無視/自由という語感から、慣習からの脱却(年功序列、必ず問屋を通す?みたいな)と同一視されているかもしれない。昔にはやったデータマイニング、ちょっと前にはやったクラウド、そして旬なビッグデータと同じでバズワードじゃね、と個人的には思う。
意味も定義もよく分からないが刺激的で万能薬みたいな効果がありそうな単語を流行らせ、その単語を冠した商品を買わせよう、というやつだ。グローバル化も、そのグローバル化を声高に叫んでいるひとたちが得するわけで、その賛同者や感化されたひとが得するわけじゃない、構造はネズミ講と同じだと思っている。親とそのすぐ下の子ぐらいまでは儲けがあるじゃね、的な。
まあ、それは横道で。
年齢を問わずに実力でひとを評価しよう、と言っていた。うん、慣習からの脱却だね、年功序列の否定。でも、同じ口で、25ぐらいまでに基本的な考えをまとめて、努力を重ねて35ぐらいまでに執行役員に・・・という。これと同じ言葉を知っている。「吾れ十五にして学に志す。三十にして立つ。四十にして惑わず・・・」孔子というひとの言葉だとすれば、15歳で学を志そう、と基本的な考えをまとめ、努力して30で学の分野で責任を取れるようになった、と。たぶん、そんな感じ。とてもファジー。や、すごいね、旧弊だという儒教的な価値観のほうがそのひとの価値をバッサリと切り捨てる年の頃がずいぶん早い、ただ努力にかかる時間は長いよね。
親を敬え、という儒教的な価値観に根付いた年功序列とかを破壊したいひとの口から儒教的な価値観に縛られた言葉がでてくる。それは、そもそもの話として慣習というのは弊害がありながらも価値があるということか、人間ていうのはどんなに聡明でも「信じたいものだけが存在し、信じられないものは存在しない」という枠から完全に脱することはできないのか、どっちだろう。
最後。
よく破壊なくして創造なし、とかいうけど、新しいものを創造したらそれに噛みあわない既存が壊されるだけであって、既存の破壊の理由に創造を付けたら、それはただの破壊だよね、何も生まないし、だれも得しない。
結果的にそうなったのか、意図してそうしたのか、分からないけど。
まとめサイトにも色々あって、最近増えてきた、ニュースネタなんかを一部引用しただけで、
あとはそのサイト自体にコメントを書かせるタイプがあるじゃないですか?
すでに「まとめサイト」と呼ぶのも違う気がする単なるコピペサイトだけど。
はてブの「コメントを一覧表示するページ」は、構造がそれと同じになってるんだ。
コピペした見出しとそれに反応した脊椎反射コメント群のように見える。
僕らははてなブックマークをそんなつもりで使ってるんじゃなかった。
そう思ってたんだけど、客観的には同じようなものなのかもしれない。
見方(見せ方)の問題で、そのように見せることも出来るってことだ。
でも、まとめサイトの名無しの書き捨てコメントと、ブログや過去のコメントに紐付いた
確かに、はてなのサービスを知らない人から見れば同じようなものかもしれない。
だけれど、ほんとにそれでいいのかな?
情報系(修士)を出た身として、また私と似たような境遇にいるなと思ったので、少しでも助けになれば。
私もまた、何がやりたいかわからず、大学の図書館に行っては特に分からない、どうにもならない本で勉強したり、あるいは情報系の資格を取得しようと奔走したりと、少し行動を起こしてみるも結局何も得られていないような学部時代を過ごしました。
そんな特に何もしていない私の転換期はというと研究室配属でした。
嫌でも人と関わる(同期や大学院の先輩、そして教授等)ことになりますし、(実験レポートなんて適当なもので許されない・授業でやったことなんてあんまり通用しない)卒論を書くことになるかと思います。
研究生活という適性もある(鬱になって休学した等が実際にあった)からなんとも言えませんが、私はその研究生活に向いていたらしく、卒論や大学院の修論でめちゃくちゃ成長できたし、研究の中で培った事柄が評価され、就職も決まりました。
私と同じタイプなら、これから来る研究にしっかり取り組めば、何かしら掴めるものはあるかと思います。
そして金銭の問題が大して無いのであれば、一先ず大学院へ進むことを薦めます。
で、今何やるかですが。
必ず必要になるし、絶対に無駄にはならないと言っていいぐらいだと思います。授業でやったことや、確率統計や線形代数など、各分野に絞った薄い本、入門レベルでもいいので身につけておく。
次に、Twitterをやってるとのことなので。
自分の学部にどんな研究室があって、研究室のホームページを見れば理論はわからなくてもどんなことをやっているのかはわかるはずですし、面白そうだと思えるものがきっとあるはずです。
面白そうな研究室が見つかれば、次はその研究室のホームページから研究業績の欄を見ます。
タイトルでググれば論文が出てきますし、様々な学会での業績が見られます。
そして、その学会でググれば他の大学の研究も出てきますし、その発表者の研究室のページへ行けばTwitterのIDも手に入るかもしれない。
ここまでくればその面白そうな研究分野の研究をしている人をTwitterの非公開リストにぶっこみます。
また、フォローしている人たちを見て、あとは芋づる式にリストにぶっこめば、最先端の技術についてつぶやくTLのできあがりです。
私はこうやって先人達の姿を見て、やるべきことや新たな発見等あったしモチベーション維持にも繋がった。
現状で簡単にできるのはこの辺りでしょうか。
ここからは私もしていなかったので、偉そうな事を言ってしまいますが、
一つのことをやり遂げること、勉強にしろ何にしろ並行してやっててもいいので、何か一つは極めたといえるもの(いや、実際には無理でもね。自信を持って言えたらいいんです)を今からでも全く遅くないのでやるといいかもです。
何も思いつかなければ、数学、もしくはプログラミングを極めておいてください。
個人的には最近ビッグデータが云々うるさいので、統計学について調べておいてください。
眠いので以上です。