http://ja.wikipedia.org/wiki/%E3%83%93%E3%83%83%E3%82%B0%E3%83%87%E3%83%BC%E3%82%BF
ビッグデータのサイズは、常に動いている目標値であり、単一のデータ集合内では、2012年現在数十テラバイトから数ペタバイトの範囲である。

定義上は　多めに見積もってようやく　下限ギリギリに入るけど　ペタバイト　クラスが　一般的なビッグデーターじゃね？

１桁から２桁　足りないよ。

売上高から逆算すると１レコード１K　ぐらいで、ようやく１テラ／月だけど　正規化された売上DBは普通１レコードそんなに無い。

※侮蔑表現が入っていました。ごめんなさい。

Permalink | 記事への反応(0) | 14:58

■http://anond.hatelabo.jp/20140127132016

だから何台なんだよ。スパコンだってさっこんはクラスターなんだから台数は重要。

PC１０台でできるようなことは、ビッグデーターとは言わない。

ちなみにビッグデーターの生みの親Googleは　世界中で　日々検索されているデーターだぞ。

Googleの１日の検索とその過去のデーターの組み合わせを　ビッグデーターと呼んでいるのに　

お前らは　たかだか日本のコンビニだけでGoogleと勝負する気か？

コンビニの売上はGoogleの検索数と匹敵するのか？

おらが村すぎる。せめて、世界規模のスケールでなければビッグデーターとは呼べない。

Permalink | 記事への反応(3) | 13:23

■http://anond.hatelabo.jp/20140127131353

コンビニ１店舗ぐらい　PC１台で処理できるのでは？

コンビニ１店舗で、クラウド使って　数千台のPCで同時並行処理する必要性があるか？

今日日のPCならSSD積んでCorei7とかなら　バッチ処理で良ければ　かなりの数のコンビニでもPC１台で処理できるだろ

全然　ビッグじゃないだろ。　クラウド以前から出来たことはビッグデーターじゃない。ただのデーター解析。

クラウド以後の、数十台、数百台、数千台のPCを使って　処理していくのが　ビッグデーター

Permalink | 記事への反応(1) | 13:15

■http://anond.hatelabo.jp/20140127130853

商品を売りたいから　既存のただのデーター解析ソフトを　ビッグデーターといって売ろうとしている人達がいるんだろ。

よくある。もうビッグデーターは終わった。

一時期の　メイドカフェ　を　頑なにメードカフェと書いて、自分たちが決め用語ルールは徹底的に守るくせに

なんで、こういう技術用語の氾濫を守ってくれないのかなぁ。用語定義守ってよ。

Permalink | 記事への反応(0) | 13:12

■http://anond.hatelabo.jp/20140127095616

10年前から扱える情報、しかもモロに商品情報なんてビッグデータって言わないから。

そんなこと言ったら世の中のデータ解析全部ビックデータ解析になるだろ…

Permalink | 記事への反応(2) | 13:08

■http://anond.hatelabo.jp/20140127093737

いいや、ビッグデータ以外に無人コンビニで売り場を作り込む方法はない。

入店した顧客の全属性データを自動で取って、手足の動きはもちろん、視線の動きも全部取る必要がある。

もちろん、ビッグデータなんて単語が登場する以前から拾ってた天候だの気温だの季節要因だのも拾う。

昼の番組でみのもんた（じゃないや）が何を勧めるのかなんとか、そういう情報も従来通り使う。

だが、客の、購買に至る前の情報を拾わずにコンビニの売り場を作ることは無理で、これを無人化コンビニでやろうと思えばはビッグデータというバズワードが登場してから（あるいはこれから）の自動化手法しか頼れる物はない。

そこまでやってやっと、現在の売り場と同じ精度で売り込む売り場を作れる。

要するに現在ベテラン店員が店先に立って空気感を感じながら接客しながら売り場を作ってるというのはそういうこと。

ベテラン店員（店長・オーナー含む）のスキルを安く買い叩く方が現状では得策であるし、予見しうる将来に逆転する可能性も低い

もちろん上記は嘘だ。

本当は「声かけ」ができないし、手書きポップの威力も大幅ダウンが見込まれるから、「何か」が開発できない限り売り場のパフォーマンスはがた落ち間違い無し。

Permalink | 記事への反応(1) | 12:59

■http://anond.hatelabo.jp/20140127095616

そんなことはないよ。売れ筋じゃない商品はさっさと消える。利幅の薄い商品はいいものでも消えていく。

ほんとビッグデーターは衆愚政治だから、いい物が消えていく。

店にとっては売れるものがいいものなのかもしれないが、一時的なブームに左右されすぎて安定した価格の中程度の品質の良い物が売れなくなっていく。バブルだよ。

ビッグデーターは衆愚政治

Permalink | 記事への反応(1) | 10:00

■こうすればセルフレジにできるコンビニ

http://anond.hatelabo.jp/20140126203007

店舗の入口と出口を完全分離、出入口は当然自動改札と同じ形態に
店内の全商品にNFCだかなんだか、電子タグを埋め込む
出口で電子マネーで決済。もちろんタグ使って自動集計。
店内全域を常時監視し、タグの発信情報が消えると（＝万引きしてタグの信号を遮断できる袋に入れたら）警報が鳴り出入り口をロック。店内にたまたま居合わせた客はとばっちりで警備員が来て犯人が確保されるまで店から出られない。
アイテム数は大幅に絞り込む。商品補充が配送時の巡回人員プラスアルファ程度しか確保できないため、現在のような複雑なディスプレイは不可能になる
人間による管理必須でタグ埋め込みの難しい、おでんを筆頭とするカウンター FFは全廃
宅急便の受け付け、料金収納、その他諸々の業務はそれぞれ専用機を配備（システムを別系統にせざるを得ないため）。もちろん設置コストに見合う収益のあるビジネスにはならないため、ごく一部の例外的な店舗を除き、それらの業務は取扱を外れる

これがコンビニかといえばもちろん違う。売り上げ効率は遙かに、遙かに低下する。都市部であれば設備投資と土地代に見合うビジネスにはならない(自販機並べる方がマシだろう)。土地と人手の余っている地方部でも同様に成り立たないだろう。

コンビニは商品を置いて客が来るのを待っているだけの商売ではない。売り場を作り込んで、「売り込む」ことで成立している業態なのだ。

セブンが主導して作り上げた「タンピンカンリ」こそがコンビニシステムの中核だが、これは本来は常時店舗に人間が張り付けることで発生する、無駄な客待ちの時間を、商品を売り込むために売り場を作り込む時間に転換したということである

ビッグデータがバズワードで終わらなければ、そのうちに売り場作りも自動化できるようになるかもしれないが、そこまでシステム開発が進むとすれば、それは単に「人手の確保」が至難となり、店舗展開に支障が出るようになった場合だけだろう。

元増田の言ってることは逆で、人間がやるのが困難な仕事から機械化される、という「本来の機械化」がコンビニの場合での正解である

Permalink | 記事への反応(4) | 09:30

2014-01-24

■『35,000円でNexus5を衝動買いした話』の後日談

　先回のエントリー( http://anond.hatelabo.jp/20140119132435 )はそこそこ好評だったようで、『Nexus5』でググるとトップページの上から2番目に表示されます(2014/01/24 現在)。

　Google先生のビッグデータをもってすれば、私を社会的に抹殺することは簡単ですが、メリケン人のデモクラシーとリバティーの精神はきっと私を赦してくれるはずです。赦してください。

　前回までの話を三行でまとめると、

　　1. iPhone持ってるけどNexus5が欲しくなって衝動買いした。

　　2. やっぱiPhoneの方が使いやすいな。

　　3. Nexus5が文鎮になる。

　です。

　このGoogle製文鎮で何枚も『倹約』、『清貧』といった戒めの言葉を書きました。ちなみに給料日までの食費は弟(18歳)に借りました。

　お習字にはもう飽きたので、今回は『文鎮化したNexus5をiPhoneライクな使える端末に変える』話を書きます。

　以下、私がした具体的な作業を列挙します。

　施策① アプリのインストール

　　『既に持っているiPhoneと同じアプリをインストールする』という、既に結論が最初から決まっている会議と同じくらい有意義な作業をします。

　　Android用がリリースされていない、あるけどイマイチ使い勝手が良くないアプリは、代替物を頑張って探します。

　　私は『GoodReader』の代用品を見つけるのに苦労しました。というか、見つかりませんでした。Good〜を作ったヤツは天才だと思います。Good！

　　ニコ動プレイヤーは非公式アプリ( https://play.google.com/store/apps/details?id=net.binzume.android.nicoplayer&hl=ja )が良いです。

　　Google日本語入力は賢いです。ATOKに1,500円払う必要はないんじゃないかな。

　　有料アプリを買う時は、セブンイレブンで売っているGoogle Play ギフトカードを使うと良いでしょう。

　　Nexus7が当たるキャンペーン( http://vdpro.jp/google.seven/ )をやってます。もう要らないわ。

　施策② 動作を軽快にする

　　バッググラウンドでメモリを喰っているタスクを減らす作業をします。

　　Zapper( https://play.google.com/store/apps/details?id=com.lookout.zapper&hl=ja )のようなタスクキラーアプリを使ってメモリを解放します。

　　必要に応じて各アプリの設定を変え、なるべくメモリを消費しないようにします。

　　とりわけ勝手に常駐したり、バックグラウンドで動き出す迷惑なタスクはぶった切っていきます。

　施策③ ウィジェットでホーム画面をiOSライクにする

　　これは諦めました。

　　あまり iPhone風の見た目にならなかったり、パソコンとデータをやりとりしたりと面倒です。

　　好事家は『Android ウィジェット iPhone風』でグーグル先生に相談してみてください。

　Nexus5をiPhone化するために私がやったことは以上です。

　他にも、Nexus5用クリアケースを魔改造して外観をiPhoneにするという考えが脳裏をよぎりましたが、既に結論が(ry くらい非生産的なので自制しました。

　あとはカス ROMでしょうか。カーネルに手を突っ込んで、本当に文鎮化したらテンション爆アゲ↑↑ですね。

　上に書いたことをNexus5にしてあげると、多少は使える端末になります。

　同じことをすれば、他のAndroid端末も利便性が向上するのではないでしょうか。

　ただ、機種によっては『消せないゴミアプリがプリインストール』されていたり、『OSの更新をメーカーが真面目にやらない』といった困難があるようです。諦めましょう。

　まぁ、一番良いのはiPhoneを使うことなんですけどね。誰か、私のNexus5買ってください。弟への借入金返済に充てます。

Permalink | 記事への反応(1) | 18:18

2014-01-22

■「グラフ」という観念を発明した人は天才

ふと思ったが、「棒グラフ」「折れ線グラフ」とか、「グラフ」と言う観念を発明した人は天才だと思う。

いわば「データの見える化」の元祖。

グラフが発明されてなければ、技術や経済発展のスピードは１割程度遅くなっていたのでは？

最近自分が仕事で愛用してるのは「バルーングラフ」。

Ｘ軸Ｙ軸にバルーンの大きさが加わるため、三次元で変数を可視化出来るスグレモノ。

バルーンの色やグラデーションを変えれば、四次元の変数を表現できなくない。

（但し最初にバルーングラフの読み方を聴衆に説明する必要あり）

カルビーは、経営者が２０種の経営指標グラフを毎日チェックしながら経営する「コックピット経営」しているそうだが、

多分こういう「多元グラフ」も活用してるんだろうなあ、と思う。

で、「ビッグデータアナリスト」の養成が最近叫ばれてるが、

その前に「各種変数をいかに最適に可視化、グラフ化するスキル」の教育が必要じゃないか、と思う。

一種のプレゼンスキルだが、高校辺りで必修にすべき。

零細商店主とかラーメン屋のオヤジとか、各種経営データをグラフ化するスキルとか持ち合わせてないだろうなあ。

グラフ化すれば経営の弱点が一目瞭然なのに。

この辺のデータ可視化技術の有無で、損している個人経営者とか、多いんじゃないか？

Permalink | 記事への反応(1) | 12:50

2014-01-16

■http://anond.hatelabo.jp/20140116111519

それが取り出せるようになったとしたら――それは、本当の意味での「ビッグデータ」といえるのではないだろうか。

人間が脊髄反射してる内容なんて大して個体差ないだろ

（例えば「自転車の運転」に関する記憶内容が、個人によってそこまで差があるとは思えない）

そんなもん収集したって「ビッグデータ」っていうほどのもんにはならんだろ。

別にビッグじゃねーよ。多分な。

Permalink | 記事への反応(0) | 11:43

■http://anond.hatelabo.jp/20140116101335

こういう奴がマジな顔して日経ビジネスとか読んでビッグデータとか言ってるんだろうな…

日経とか読まなくていいから統計学の入門書を1冊でも読んでくんねーかな…。

Permalink | 記事への反応(0) | 10:30

2013-12-21

■http://akiradeveloper.hatenadiary.com/entry/2013/12/21/184119

> Githubにアクセス出来ないと言ってもイマドキのエンジニアは誰も信じないだろう

え、事業部は数年前からはてダアクセス禁止だったし、yumやapt-getとかもっての他でパッケージ一つ毎に上司の承認が必要でしたが？

横浜研究所がなんなのかあんま把握してない(元シ研かな？)けど、Linuxとストレージ関係の部門とは・・

自分は優秀じゃなくて落ちこぼれで外に出ていきましたが、ほんと所員に外見てきてほしいとは思う。

ところで自分がやめるとき周りの人全然 Hadoopとか知らなかったんだけど、ビッグデータ周りの推進は研究所主体ということで合ってます？

(高速独自DBの可能性もあるけど)

Permalink | 記事への反応(0) | 21:45

2013-12-18

■*デザイン、プログラマーとやって来て、やっぱり自分に合わなかった事を書いた

初めまして。前回「Web系の会社を解雇されて思った事」を皆さんに読んで頂いて大変うれしい。自分はと言うととりあえず会社らしき所で働いているが、もう辞めたい病発症中だ。以下辞めたい病の内容を職種別に話そうと思う。

デザイン系の会社に居て思った事

Webという仕事をやってて一番嫌いなのがこのデザインと言う仕事だ。大手企業に入社できない大手病まっしぐらの28歳の自分としては、どうしても事業規模の小さい会社で仕事する事が多く、デザインの方向性から自分が担当する事がある。ここで俺がデザインを嫌いな理由は「そもそも何でデザイン作成や改修をするんですか？」とやる目的が見えない時があるからだ。まずデザインや文章を書いていく上で重要な事を書くと、

1.相手に何を伝えたいか？

2.どのような伝えていく事で、相手にどのような印象を与えていくか？

の2つ。例えばこの文章は「俺が仕事の愚痴を書いて、皆さんに共感してもらう」事や「こいつはこういう仕事が向いていない奴」「こいつは仕事本体より愚痴になると心が踊る奴だ」と言う印象を皆さんに与える為に書いている。

相手に合わせた商品を提案する事も大切

さてAKB48だろうと「普通な女の子が歌う歌」と言う方向性があるし、西野カナにしても「失恋に悩む女の子」と言う方向性があって、それに則ってお金を取っているわけだ。その点を煮詰める事が一番肝心だし、そもそもの方向性が定まってないのにサイトを作るのは「敢えて言おう。無駄であると」と言いたい。

それこそサイトを受注する料金がかかるのならば無料ブログでも良い。それこそキャバ嬢や風俗嬢の女の子が個人サイトでも持って営業したからと言って、収益に結びつくのだろうか？否そうではない。要は見た目の良さや機能性のみだけがサイトや商品の善し悪しを決める訳ではなく、相手に合わせ的確なものを選ぶのが肝要であり、そういう話が無いデザイン会社を受けるのは絶対に受験するのを止めろと言いたい。キャバ嬢から話を話して、千葉県のCafe GAKEのブログなどを見ていても思う事で、そのお店の雰囲気や店長の人柄が伝わればそれで良いと思っている。

3社目は見てくればかりでとにかく苦手だった

さて3社目にいた時はどうだったか？機能や見た目に浮かれるような上だったからこそ最悪だった。結論から言えば「Photoshopでスライスし、パーツ画像を作成するコツと方法(Webクリエイターボックス)」に書いてあるようなPhotoshopのスライスの切り方や、各部分の間隔のそろえ方などデザインに関する技術を覚えられたのは良かったと思う。しかし企画としては明らかに失敗と思うケースは意外にある。

具体的には「○○をユーザーによく見せる為に、△△なサイトのデザインにしていく」と言う何故このデザインにするの？と言う説明が無いままいきなり作ってと言う流れに。そりゃあ慣れないプログラム言語を使ってデザイン部分〜データーベース部分に至るまでほぼ一人でやっていた訳だ。しかし終始上は上で俺が作ったページが最高だ！と言わん顔。クライアントとの打ち合わせ会議から帰って来ると「サイトの画像のエフェクトを使うという冒険をしたくないのか？」とクライアントを非難する事を陰で言ってるあたり、そもそも何の為に作っているのかをお互い摺り合わせていない事がわかった。

無論技術を見せびらかして「素人目に見てこうした方が凄い」とのたまっていたが、はっきり言って見る人は絶対に見ない。そもそも今の俺がそうだから。と言う訳でどうも俺はデザインが似合わない事が分かった。

ソーシャルゲーム系の会社に居て思った事

と同様に俺はプログラムと言う名の現場開発もどうも苦手だった。俺はエロ系のサイトの改修をやっていたときは「世界最強のエロサイトを作ってやるぜ」と息を巻いていた。しかしソーシャルゲームはどうか？お姉ちゃんのおっぱいも関係ないし、かといってお尻も関係ない生活が3ヶ月続いた。そもそも無機質なカードを見て欲情できる奴らの気持ちが理解できず、なんでこんな物で満足できるのだろうと思っていた。

Coupon Collectors Ploblemとの素敵な出会い

しかし会社をクビになる頃、俺はすばらしい数学の問題に出会ったのだ。Twitter経由で「コンプガチャの数理 -コンプに必要な期待回数の計算方法について-:doryokujin's blog」に書かれていた、Coupon Collectors Ploblemと言う命題に非常に感激した。これはnを自然数としてn種類のクーポンの出現確率が同じと仮定した場合、n種類のクーポン全てが出そろう枚数の期待値 E(n) = n(1 + 1/2 +1/3 + …… + 1/n)(枚)となると言うもの。

この時マクドナルドで3種類のコーラグラスを集めるキャンペーンをやっていて、セットを幾ら頼めば良いかなんてのを暗算で弾いたのは良い思い出。n=3なのでE(3) = 11/2で、セット一種類当たりの値段が600円だから3種類全て出そろう期待金額= 600 * 11/2 = 3'300(円)なので、最初っから3種類買って全て集めたのは良い思い出だ。これがソーシャルゲーム時代に一番感激したないようで、ソーシャルゲームの運用のやり方とこのCoupon Collector's Ploblemの証明どっちを取るかと聞かれたら、すかさず後者を取るだろう。それくらい俺は物を作ると言う仕事に向いていないらしいことが分かった。むしろ統計学やデータマイニングと言った数学を駆使してできる商売や、商品企画などもっと上流の過程で仕事がしたいと思い探している。

現状

6月の面接の段階で、機械学習やクラスタリングと言った知識に穴があった。最近ではその点を補う為に「データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)」のような本を読んで、取り合えず次の会社の面接官の話のタネになる知識を集めている最中だ。大学時代が贈処理の研究をしていて、クラスタリングと言う単語は聞いた事があった。しかし実際に触れてなかったので改めてここで復習をしているのだ。

最後にこの文章をはてな匿名ダイヤリーで書いたのは、顔を隠そうと思っての事だ。「明らか向かない仕事をどうしてやるのだろう？」「デザインに関しては俺はクライアントの要求以上の事は出来ない。寧ろ美術関係の学校をでているような人に座を譲りたい。デザインに対する情熱が俺とは違う」「俺の好きな数学やデータを駆使するしごとにいきたい」としきりに思いながら仕事をしている。そして長々と愚痴を書いたが、こんな愚痴をここまでお読み頂いた皆さんには感謝だ。又こういった場を提供してくださった株式会社はてなの皆さんにも感謝する次第である。