はてなキーワード: データマイニングとは
気になるパン屋さんがある。そこでバイトしたい。お手伝いでもいい。
パンはすごく美味しいし、値段も手頃。なのにいろいろと突っ込みどころ満載で本当にもったいない。
突っ込みどころについては後述するけど、たぶん人手不足(&資金不足)のせいだと思う。
自分は完全に素人だけど、あとちょっと手間かければ倍の収益は見込めると根拠なく思ってる。
でも自分は既に学部3年生だし長く勤められるわけではない。すぐ就活で行けなくなるのは目に見えている。
短期でお世話になるのも、自分という新しい道具の導入コストが先方にかかるのは申し訳ない。
あれこれ理由をつけて当該のパン屋さんに連絡しない言い訳をし続けること、はや6ヶ月くらい。
現在夏休みなので心と時間に余裕があり、お風呂や移動時間中にパン屋さんのことを考えてしまう。
もし先方にアポを取ったら……
もし2週間だけでも使ってもらえるなら……
就活の勉強もしたい、学部の勉強もしたい、新しく人と関わりを持つのが怖い。
実行する気がないから考えるだけ時間の無駄だけど、せっかく考えたので案として書き出したい。
店主はゆるゆるやっている人なんだろうと思う。
やりたいことはあるけど、人手も少ないし(去年は社員が一人いたが辞めてしまったらしい)、無理のない範囲でやるスタンス。
店主とちゃんと話したことがないから分からないけど、自分のように「もっともっとお客さんが増えれば」とは強く思ってない気がする。
だから上記のものを伝えたところで全部が全部実行されるわけではない。
それに、仮に自分が短期バイトやお手伝いなどで入ったところで出来ることは本当に限られてるはず。
ただどんなに短くったってやれることはある。
少しでもこのパン屋さんのことを知ってもらいたい、ひとりでも多くの人に食べてもらいたい。
100円ちょっとのパンが、感動するほどじゃないけど普通に美味しいお店は、探してもなかなかない。
心を込めて丁寧につくられた個人経営のパンは、それだけで十分な価値がある。
そんな気持ちが少しでも実ってくれるのなら、やってみてもいいんだけど……(冒頭で述べたように色々言い訳をして足踏みをしている)
名前の力ってすごいよな。
全部同じ事言ってるのに、
マイルドヤンキーはださい。
プア充だと格好わるい。
クラウドだのデータマイニングだの言わずにビッグデータって言ったらヒットするみたいなやつな。
マイルドヤンキーやプア充って言葉を思いついた奴はセンスが無かった。
前者は日本人のセンスで、ミニマリスト、がアメリカ人のセンス。
年収150万で僕らは豊かに生きていく、っていうのもセンスが無い。具体的な話を書いたのも良くなかった。
僕らにはもうものは必要ない、と言い切り、それでいて概念的な話に終始するほうがよい。
イケダハヤトは煽り屋のくせに変にまじめ過ぎたからミニマリストのような素敵なバズワードを生み出せなかったということだ
出来る限りその言葉自体はできるだけ具体的な、物理的なものは何も含まないようにすること。
思想や概念といった、なんとでも言えるようなものが良い。そのほうが万人にあてはまりやすい。
それでいて、何かと比較できるようにしなくてはいけない。つまり形容詞があるといい。
「最小であること」という主義思想には、具体的には何も含まれていない。だからこそ各人が好きなモノをつめこめる。
データマイニングの基礎を知らない増田が夢みたいなことを語っていても無駄だな.
そのうえで,気付きを実現する推薦方法を考えたほうがいい.
・本当はだれかがやっていて知らないだけ
・難しすぎて誰も実現できないか
どちらかだ.
今、小生はいわゆるデータマイニングなるものの研究をしているが、レコメンデーションなるクソみたいな分野が本当にクソすぎてクソ。
アマゾンの「これを買った人は〜」みたいなものを思い浮かべてくれればいい。何がクソって、評価手法がクソ。
「他の手法より私たちの手法はこんなに優れているよ」というのを何かしらの方法で示すのが評価なわけだが、その方法の主流は
ある購入者の過去の購入履歴を見て、ある商品を買った人が次に買った商品をあてて、その精度を競うというもの。
つまり、
「購入者の特性から、ある商品Aを買ったら次は商品Bを買いそうだな。よし、実際に商品Bを買ったという履歴があるので精度100%!」
みたいなことをやるわけだ。
はぁぁぁあぁぁぁぁぁぁっぁぅぅぅうぅぅううっっっ!????????それお前の推薦がなくても買ったってことちゃうんかい!!!!!?????お前の手法超いらねえええええええxじゃあああああああん!????!!!11
こんなことを大真面目にやるのが推薦というクソみたいな分野の世界です。最近ではセレンディピティーとか言ってるらしいけど、そんなのマジでランダムに商品表示したほうがいいんじゃねえの?
つまり何が言いたいかっていうと、機械ごときにオススメなんぞ決められたくないってことです。
# EDIT
どうでもいいけどぅおぉぉぉぉなんでこのクソ日記がはてブで「暮らし」のカテゴリにはいるのぉぉぉおおおおおお????
どおおおぉおいう重み付けされちゃってるんですかねえええええええひいひひひいいんん
ひどい圧迫面接?だかなんだかを受けてフリー○ット晒しちゃったテヘッ、みたいな増田がいたけど。
まあどうでもいいけど。
ここんとこ、転職活動中で、とはいえ会社に勤めて仕事はしているので、WEBのサービスでいろいろエントリーしている。
で、D○DA(イン○リジェンス)はもしかして、もう終わった会社ですかね?
会社沿革みても、学生援護会やたUSENやらデンプやらに買われ売られで・・・。
形骸化しているだけで、すっかり中身はすっからかんな感じがぷんぷんしますけどね。
でそんなある日、ってさっきだけど、
件名:【抽選でギフト券5000円分!】DODAご登録者アンケートへのご協力依頼/DODA
というメールが届いたわけです。
===================
平素はDODAをご利用いただき誠にありがとうございます。
DODAでは、お客様に心からご満足いただけるサービスを目指しています。
ご利用いただいているサービスに関して、ぜひご意見をお聞かせください。
===================
んで、
===================
【謝礼】
大手通販サイト専用ギフト券5000円分をプレゼントいたします。
===================
とあったので、ちょっとアンケートに答えてみることにしました。
自分自身転職活動中なので意識が高い!こと、そしてAmazon?の5,000は結構イイネ!と思いましたの。
(アンケート設計、むちゃくちゃだなー)と思ってはいたけどおくびにも出さず、淡々とアンケートに答えていきます。
最終的には、以下が最終ページ。
===================
===================
あれ?Amazonのギフトカードのこと、まったく触れてないのね。
あ、これって、アレかな?よく見るアレかな?
と思い、最初のメールを見てみると、
===================
【注意事項】
※アンケートへの回答は、お一人さま1回限りとさせていただきます。
当選者ご本人のD○DA登録メールアドレス宛てにギフト券番号をお知らせいたします。
その時点でD○DAを退会済の場合、ご連絡いたしかねますのでご注意ください。
※当選者の発表は、上記のお知らせをもって代えさせていただきます。
当選結果とそのご連絡に関するお問い合わせ・ご依頼には
===================
もうこれって以下の2点で、応募者にギフト券を渡すつもりないんだなーと思われる。
→3カ月ってなんだろう?そんなに調査に時間を要すのか?データマイニングできないのか?
そもそも、薄っぺらウアンケートだったけどな。
②「当選者の発表は、上記のお知らせをもって代えさせていただきます。」
想定結論:たぶん、ギフト券支払いの社内稟議とか通してないんじゃないかな?
えらい人が「これからはユーザーの調査だ!」とか言い出して、それに対応したいけど、年度予算がキツキツで
やむを得ずの架空インセンティブきのアンケート、みたいなwww
そもそもenやリクナビNEXTに比べ、案件の質はともかくとして、転職WEBインフラとして底辺なD○DA。
初めまして。前回「Web系の会社を解雇されて思った事 」を皆さんに読んで頂いて大変うれしい。自分はと言うととりあえず会社らしき所で働いているが、もう辞めたい病発症中だ。以下辞めたい病の内容を職種別に話そうと思う。
Webという仕事をやってて一番嫌いなのがこのデザインと言う仕事だ。大手企業に入社できない大手病まっしぐらの28歳の自分としては、どうしても事業規模の小さい会社で仕事する事が多く、デザインの方向性から自分が担当する事がある。ここで俺がデザインを嫌いな理由は「そもそも何でデザイン作成や改修をするんですか?」とやる目的が見えない時があるからだ。まずデザインや文章を書いていく上で重要な事を書くと、
1.相手に何を伝えたいか?
2.どのような伝えていく事で、相手にどのような印象を与えていくか?
の2つ。例えばこの文章は「俺が仕事の愚痴を書いて、皆さんに共感してもらう」事や「こいつはこういう仕事が向いていない奴」「こいつは仕事本体より愚痴になると心が踊る奴だ」と言う印象を皆さんに与える為に書いている。
さてAKB48だろうと「普通な女の子が歌う歌」と言う方向性があるし、西野カナにしても「失恋に悩む女の子」と言う方向性があって、それに則ってお金を取っているわけだ。その点を煮詰める事が一番肝心だし、そもそもの方向性が定まってないのにサイトを作るのは「敢えて言おう。無駄であると」と言いたい。
それこそサイトを受注する料金がかかるのならば無料ブログでも良い。それこそキャバ嬢や風俗嬢の女の子が個人サイトでも持って営業したからと言って、収益に結びつくのだろうか?否そうではない。要は見た目の良さや機能性のみだけがサイトや商品の善し悪しを決める訳ではなく、相手に合わせ的確なものを選ぶのが肝要であり、そういう話が無いデザイン会社を受けるのは絶対に受験するのを止めろと言いたい。キャバ嬢から話を話して、千葉県のCafe GAKEのブログなどを見ていても思う事で、そのお店の雰囲気や店長の人柄が伝わればそれで良いと思っている。
さて3社目にいた時はどうだったか?機能や見た目に浮かれるような上だったからこそ最悪だった。結論から言えば「Photoshopでスライスし、パーツ画像を作成するコツと方法(Webクリエイターボックス)」に書いてあるようなPhotoshopのスライスの切り方や、各部分の間隔のそろえ方などデザインに関する技術を覚えられたのは良かったと思う。しかし企画としては明らかに失敗と思うケースは意外にある。
具体的には「○○をユーザーによく見せる為に、△△なサイトのデザインにしていく」と言う何故このデザインにするの?と言う説明が無いままいきなり作ってと言う流れに。そりゃあ慣れないプログラム言語を使ってデザイン部分〜データーベース部分に至るまでほぼ一人でやっていた訳だ。しかし終始上は上で俺が作ったページが最高だ!と言わん顔。クライアントとの打ち合わせ会議から帰って来ると「サイトの画像のエフェクトを使うという冒険をしたくないのか?」とクライアントを非難する事を陰で言ってるあたり、そもそも何の為に作っているのかをお互い摺り合わせていない事がわかった。
無論技術を見せびらかして「素人目に見てこうした方が凄い」とのたまっていたが、はっきり言って見る人は絶対に見ない。そもそも今の俺がそうだから。と言う訳でどうも俺はデザインが似合わない事が分かった。
と同様に俺はプログラムと言う名の現場開発もどうも苦手だった。俺はエロ系のサイトの改修をやっていたときは「世界最強のエロサイトを作ってやるぜ」と息を巻いていた。しかしソーシャルゲームはどうか?お姉ちゃんのおっぱいも関係ないし、かといってお尻も関係ない生活が3ヶ月続いた。そもそも無機質なカードを見て欲情できる奴らの気持ちが理解できず、なんでこんな物で満足できるのだろうと思っていた。
しかし会社をクビになる頃、俺はすばらしい数学の問題に出会ったのだ。Twitter経由で「コンプガチャの数理 -コンプに必要な期待回数の計算方法について-:doryokujin's blog」に書かれていた、Coupon Collectors Ploblemと言う命題に非常に感激した。これはnを自然数としてn種類のクーポンの出現確率が同じと仮定した場合、n種類のクーポン全てが出そろう枚数の期待値 E(n) = n(1 + 1/2 +1/3 + …… + 1/n)(枚)となると言うもの。
この時マクドナルドで3種類のコーラグラスを集めるキャンペーンをやっていて、セットを幾ら頼めば良いかなんてのを暗算で弾いたのは良い思い出。n=3なのでE(3) = 11/2で、セット一種類当たりの値段が600円だから3種類全て出そろう期待金額= 600 * 11/2 = 3'300(円)なので、最初っから3種類買って全て集めたのは良い思い出だ。これがソーシャルゲーム時代に一番感激したないようで、ソーシャルゲームの運用のやり方とこのCoupon Collector's Ploblemの証明どっちを取るかと聞かれたら、すかさず後者を取るだろう。それくらい俺は物を作ると言う仕事に向いていないらしいことが分かった。むしろ統計学やデータマイニングと言った数学を駆使してできる商売や、商品企画などもっと上流の過程で仕事がしたいと思い探している。
6月の面接の段階で、機械学習やクラスタリングと言った知識に穴があった。最近ではその点を補う為に「データサイエンティスト養成読本 [ビッグデータ時代のビジネスを支えるデータ分析力が身につく! ] (Software Design plus)」のような本を読んで、取り合えず次の会社の面接官の話のタネになる知識を集めている最中だ。大学時代が贈処理の研究をしていて、クラスタリングと言う単語は聞いた事があった。しかし実際に触れてなかったので改めてここで復習をしているのだ。
最後にこの文章をはてな匿名ダイヤリーで書いたのは、顔を隠そうと思っての事だ。「明らか向かない仕事をどうしてやるのだろう?」「デザインに関しては俺はクライアントの要求以上の事は出来ない。寧ろ美術関係の学校をでているような人に座を譲りたい。デザインに対する情熱が俺とは違う」「俺の好きな数学やデータを駆使するしごとにいきたい」としきりに思いながら仕事をしている。そして長々と愚痴を書いたが、こんな愚痴をここまでお読み頂いた皆さんには感謝だ。又こういった場を提供してくださった株式会社はてなの皆さんにも感謝する次第である。
そうそう。
俺の周りのいわゆる「イクメン」系の人は、みんな仕事をかなり抑えてる。
(最近では妻子を持つためにアカデミアを諦めてデータマイニング系の仕事に就く、というパターンが凄く多い。
一昔前は「私は研究ではなく問題解決そのものが好きだったのです」というテンプレと共に外銀か戦コンに行く人が多かった。
あの頃に比べれば状況は多少マシになったのかもしれん)
あるいは表面上イクメンのポーズを取ってるだけで実際は奥さんに丸投げ。
それでも確かに女性よりは仕事する余裕あると思うけど、その代わり、何かの拍子にクソつまんない仕事をする羽目になってしまっても、
SEOが次にどうなっていくのかを考えてみた。
社内でSEOについて話しても
この繰り返しなので話が進まない。
ビックデータを扱う時に行うデータクレンジングを強化してスキーム化したものだと思ってる。
こんなのをいちいち手作業を基本としてやってたらコスト無限大なので
パンダアップデートはほんとどうても良くてこんなの対処できないウェブマスターとか
中規模以上のシステム担当者はチェンジしてもらったほうが世のためになる。
このレベルのウェブマスターに適当なこと吹き込んで状況を悪化させる
で、次にどうなっていくかを考えると
リアルタイムレコメンドの性質が強化されそう。パーソナライズとは関係ない。
これにセマンティック強化の流れがかみ合うと
それが検索結果にも同じく入ってくるのかと考えると
そんな顧客満足度を下げるような事はしない。
まずGoogleが定義した仕様の通りにサイトを作ること。W3CじゃなくてGoogle。
次にデータクレンジングのトレンドをリアルタイムに把握すること。
ようするにペンギンにやられないように先手を打つこと。
10とか20とかじゃ意味がなく、統計で使うので母数に最低1000は欲しい。
母数として利用で出来るサイトを抽出するのにさらに10倍以上のサイト数が必要。
技術に理解のない会社はデータマイニングをエクセルでやりたがるけど、無謀。
どんなにサイトをホワイトハットで言う所のクリーンな状態にしたって
検索結果の上位には表示されない。
キーワードの解釈され方の傾向を掴むのは統計じゃ出来ないのは必然。
どの状態であればGoogleから好意的に解釈されるかを意思決定するAIの出番なんだろうか?
先読みして何かする部類のものはないと思ってる。
ツールベンダーが多数出てきたり。
http://anond.hatelabo.jp/20130518113621
そうですね。ソシャゲと心理学的行動分析は中にプロが居る為、ここらへんは現場の人たちは感覚で作ってる感あります。
あとは徹底的なデータマイニングによるテストをやった結果、今の流れなんです。(チュートリアルを丁寧にした→DAU上がったとかそういう事を幾多・・・)
余談に書いてあったFlash→HTML5のFlashっぽい感じってところですが、FlashをHTML5に変換するものがあったり、
ASの記法ほぼそのままでJavascriptAnimationで書けるものとかあるんで、そういうふうになってます。
ファーストリテイリングの会長のインタビュー記事をよんだ。
時代はグローバル化だ、そうだ。そもそもグローバル化ってなんだろう。辞書的な意味は、国家なんかの垣根をこえて自由に経済しましょう、ということだろう。境界の無視/自由という語感から、慣習からの脱却(年功序列、必ず問屋を通す?みたいな)と同一視されているかもしれない。昔にはやったデータマイニング、ちょっと前にはやったクラウド、そして旬なビッグデータと同じでバズワードじゃね、と個人的には思う。
意味も定義もよく分からないが刺激的で万能薬みたいな効果がありそうな単語を流行らせ、その単語を冠した商品を買わせよう、というやつだ。グローバル化も、そのグローバル化を声高に叫んでいるひとたちが得するわけで、その賛同者や感化されたひとが得するわけじゃない、構造はネズミ講と同じだと思っている。親とそのすぐ下の子ぐらいまでは儲けがあるじゃね、的な。
まあ、それは横道で。
年齢を問わずに実力でひとを評価しよう、と言っていた。うん、慣習からの脱却だね、年功序列の否定。でも、同じ口で、25ぐらいまでに基本的な考えをまとめて、努力を重ねて35ぐらいまでに執行役員に・・・という。これと同じ言葉を知っている。「吾れ十五にして学に志す。三十にして立つ。四十にして惑わず・・・」孔子というひとの言葉だとすれば、15歳で学を志そう、と基本的な考えをまとめ、努力して30で学の分野で責任を取れるようになった、と。たぶん、そんな感じ。とてもファジー。や、すごいね、旧弊だという儒教的な価値観のほうがそのひとの価値をバッサリと切り捨てる年の頃がずいぶん早い、ただ努力にかかる時間は長いよね。
親を敬え、という儒教的な価値観に根付いた年功序列とかを破壊したいひとの口から儒教的な価値観に縛られた言葉がでてくる。それは、そもそもの話として慣習というのは弊害がありながらも価値があるということか、人間ていうのはどんなに聡明でも「信じたいものだけが存在し、信じられないものは存在しない」という枠から完全に脱することはできないのか、どっちだろう。
最後。
よく破壊なくして創造なし、とかいうけど、新しいものを創造したらそれに噛みあわない既存が壊されるだけであって、既存の破壊の理由に創造を付けたら、それはただの破壊だよね、何も生まないし、だれも得しない。
「データサイエンティスト」自体が完全にバズワード化してるから、実態はみんなそんなもんだと思うぞ。
データサイエンティスト(笑)とか名刺に書かせておきながら勉強するのを許さないような会社なんだったら、
その肩書きを武器にデータマイニングがバズってるうちにもっとマシな会社に転職しておくのがいいだろう。
あと最近のブームで巷にあふれる「データが世界を制する!」みたいな感じの本とか、
「文系馬鹿でもわかる萌え萌え統計学」みたいなのとかはあんま読まない方がいいんじゃないかなと個人的には思う。
http://www.amazon.co.jp/dp/4130420658/
http://www.amazon.co.jp/dp/4130420674/
http://www.amazon.co.jp/dp/4563008281/
http://www.amazon.co.jp/dp/400006973X/
本は例えばこの辺か。
5年前、携帯ゲームSNSサイトが既存ゲーム市場を激変させると誰が予想していたでしょうか?
そして5年後、同様の破壊的イノベーションが、教育の分野でも起こると予想(願望)しています。
1対マス(教師×生徒)型の教育から、マス対1(多種多様な教材×生徒)型の教育プラットフォームが主流になるでしょう。
http://www.codecademy.com たとえばこんな感じのサイト
有名大学や有名塾講師の講義内容を無料で映像配信するプラットフォーム
lang-8や、四択問題クイズサイトのような、ユーザーが教師であり、生徒でもあるようなSNS型プラットフォーム
多種多様な教育コンテンツを企業が提供するSNS型プラットフォーム。
お得意のデータマイニングで、学習者にとって最適な教材を提供。ただ、ゲームと違って、言語の壁を乗り越えるのが大変そう。
ここまで書いて、稚拙な文章と分析しかできなくて情けなくなったので、言いたいことをまとめると、
デジタルデバイスとネット接続環境があれば、誰でも無料で教育を受けられるプラットフォームが誕生
↓
従来の学校教育に馴染めなかった人も、多種多様な教材で楽しく勉強できるような設計。(細かい目標達成を感じられたり、ゲーム的要素だったり)
従来の学校教育の進度が遅い/早いためにフィットしなかった人にも最適な学習環境が得られる。
教育の生産性が向上し、18歳で大学教授並のパフォーマンスとか出せちゃう、教育界の石川遼クン的人材がたくさん出てくる。
良質なスクリーニングで、センター試験とか大学の二次試験も廃止でコスト低下
↓
新技術の台頭により、職を失ってしまった人も、新技術を学べ、再チャレンジ可能な社会へ
↓
既存の公教育は、ディベートや、コミュニケーション、発想、創造力、を鍛える教育へ
↓
みたいな妄想をしてた。
過当競争で毎年自殺者3万人出てるなんて戦争やってんじゃねーんだぞこらー!(全然関係ない)
以上、孤独と不安で頭がおかしくなったニートの戯れ言でした。誰かかまってください。
本の紹介忘れてた
教育×破壊的イノベーション 教育現場を抜本的に変革する: クレイトン・クリステンセン, マイケル・ホーン, カーティス・ジョンソン, 櫻井 祐子: 本