「サイエンティスト」を含む日記 RSS

はてなキーワード: サイエンティストとは

2018-04-26

データサイエンティストが働いて嫌だったなと思う人たち

コンサルにてアナリストをやった後、データサイエンティストを名乗りながら仕事をしています。そんな中で嫌だったなと思った人たちとプロジェクト

1.医療統計の周りの人

最近アウトカムでの評価の流れにはなってきたが、まだまだモデル評価をする事は少ない。

でも何故か相変わらずロジステックとCox回帰をやれればおっけーであり、モデルの精度が当たらなくてもオッズ比と説明変数

有意差だけでていれば上手く行く分野。 本当に心が痛む上、まだまだ「医者でなければ人であらず」が通ってしまい、モデル説明よりもお医者様のお言葉が1stにきてしまう。また分析プロジェクト

設計らしい設計があまり出来ないのもつらいところ(モデルの精度が出ていないのにそのオッズ比・有意差に何の意味があるんだと思う)。後日本の製薬企業から「何とか工夫で有意差がでないのか!!」

という謎おしかりを受ける・・・いやそんなん無理ですやんと切実に思う。やる気でこの世界数字は変わりません。

後は何だかんだ製薬企業日本の古いしきたりが多いので面倒。

2.Google Analyticsアナリスト関連

割と良いBIみたいなんが良くも悪くもあるためアナリストの人たちがやった気になっているやつ。Web関係アナリストは、アナリストを名乗って欲しくない人の方が多いイメージ(勿論しっかりWebアナリストやっている方々は知っている)。広告内容を分類し、CV予測、そしてマルチチャネル予算からCV最適化案件をしていたらWebアナリストから「私の作るLPは最適です。なので予算4000万です」という謎の最適の主張を受けたのはいい思い出(何故かデザイナー様がWebアナリストもやっていた)。広告内容のuser2vecでのレコメンド実装チャレンジして評価して、協調フィルタリングよりも精度はよさげだな喜んでいたら、どっかのよくわからないレコメンドツールというのが汎用性もあるし、既存ツールに1万ぐらい払えば追加できるとそして何故か「最適化」されているという言葉役員が騙されて決済がおりていたのを聞いたとき殺意が沸いた。どうせ既存マーケティングオートメーションレコメンドエンジンなんて協調フィルタリング・ロジぐらいだろうと思っている。本気で分析やっている人がそうそ最適化なんて言葉を使わないと思うんだ・・・まぁここの反省Web業界といってもみんなコーディングがりがりではなくてGUIでいいならそれでが割と多いという事を学んだ (注意)。

3.データベース関連

どっかの人のにもあったが、「あっ、データ分析分かるんだよね?」という事でVB6Accessの改修をやらされそうになったときは全力で拒否った。

後は何故かPHP+MySQLあん(ry

VB6見た後でPythonコードを見ると心が癒された。

4.やる気を説いて来る人達

やる気で数字が変わったら誰も苦労なんてしないんだよ・・・。半教師有り等で精度向上見込めるといってもいくらなんでもこのデータでは

運用目標には到達しないとしか思えないんだ。

5.ホワイトボックステスト要求されたとき

モデルホワイトボックステストってどうやってやるんだ?精度を検証データでやっていれば良いじゃないかと思っていた。ただそこの金融系でITプロジェクトは、基本的に「ホワイトボックステスト」やらが必須らしく・・・おいおい・・。とりあえずカテゴリー目的変数がそれぞれの値を取ることを客先で見せてかつレポートで「こうこうこうゆうときカテゴリー変数が変わりますよ」という彼らがいう境界線確認を全てやることになった。カバレッジ100%も言われたが、流石に無さ過ぎるので諦めてもらった。

6.KGIとKPIしっかり切り分けてBI作成していたら集計屋かといって来られる時

どこかの人にもあったが、私はビジネスが動けばよいと思っているので難しい分析をしなくても上手く行く時は、集計で上手く切り分けて、要因分析をやる(裏で決定木とかで境界値とかは見ていたりする)。ただ何故かそれで集計ばかりしかしていないと怒られる。別に研究者ではないし、難しい分析をしてクライアントへの説明時間を取られたり、展開が難しくなるぐらいならば皆と合意した上で、KPIとKGIを切り分けてダッシュボード作成をしっかり出来る方が実はビジネス上上手く行くだ。むしろ自分への戒めでいつも難しい分析が本当に必要なのかと思ってるぐらいである。

注意 因みに私の別部署インフラ基盤周りのWordpress関係炎上していた。そこそこの大規模でWordpress使うって大変らしいのに・・・

勿論これの逆、評価した上で、分析ビジネスにしっかりと生かしていける人は大好きです。

2018-04-23

AI勉強して仕事あるの?

ずっと疑問なんだが

現実問題仕事求人案件)がどれほどあるのか

検索してみると出てくるのはデータサイエンティスト職だが、それは旧来のデータサイエンティスト仕事だろう?

別にAI職というのが新しくバーっと生まれたわけではない

いや語弊があるか

ディープラーニング等の新技術を売り込む会社はほんの少しだけ生まれてる

でも求人情報を眺めると、主たる業種は、データサイエンティスト生産管理とかそっち系

 

別にその求人状況自体は悪くない

しかし「AI仕事になる」と勘違いして勉強してる人が多すぎないか

しろ勉強その物がビジネスになってやしないか特に学校

こういうのってバブルですら無い虚業で、数年後目が覚めた時大量の難民を生むんだよなあ

芸人歌手声優クリエイター、そういった学校のほうが強い界隈に成り果てるのではないか

 

AIが生まれても、技術がどう変わっても、世の中のビジネスモデルと言うものは大して変わらない

どこかで儲けなければならない縛りがあるから技術だけで仕事は生まれない

勉強する前に、一度ソレは本当にビジネス足り得るのかよく考えてみて欲しい

ビジネスたり得ないのなら、それは趣味研究の部類だ

2018-04-11

有名データサイエンティストでも

こんな文系マーケティング経済学の力を借りようとしているのに。

https://twitter.com/TJO_datasci/status/983734237432987648

大方の任意統計モデルStan使うか粒子フィルタとかでパラメータ推定できるようになってきたので、どちらかというと経済学系やマーケティングサイエンス系のテキストを読んでどんなモデル式の候補が世の中であり得るかを勉強した方が良い気がしてきた

実験ができるような理系の分野ではなく仕事に使えるような数理モデル統計は、経済学の方が一般的理系よりも進んでいる。

https://anond.hatelabo.jp/20180409070811

2018-03-13

NHK プロフェッショナル 仕事の流儀 ヒカキン ウメハラ

第352回 2018年3月19日(月) 放送予定

夜7:30~73分拡大版

新しい仕事スペシャル

今回は、時代が生み出した新しい仕事プロたちを特集するスペシャル。まずは、新しい仕事代名詞とも言える「ユーチューバー」。作成した動画の総再生回数79億回以上、チャンネル登録者数1,100万人を超え、日本トップを誇るユーチューバー、HIKAKIN(ヒカキン)28歳に、テレビ初となる密着。その成功は、日々のたゆまぬ努力で成し遂げられている。こだわりを追求するために、企画から出演、撮影編集までを一人で行い、1年365日、ほぼ1日中自宅で仕事をしている。

そして、日本人として初めて「プロゲーマー」となった、梅原大吾(うめはらだいご)、36歳。幼い頃から格闘ゲーム世界頭角をあらわすも、それを仕事にするなんて考えられず、一度は介護仕事に就いた梅原。しかし8年前、悩み抜いた末に、新たな仕事の道に踏み出し、業界未来を切り開いた。さらに、今世紀最も魅力的な職業と称される、ビッグデータ分析者「データサイエンティスト」など、番組では、時代最先端を突き進むプロたちの生きざまに迫る。

2018-03-03

電卓珠算係の仕事を奪った時、私は声を上げなかった

ワープロソフト写植技師仕事を奪った時、私は声を上げなかった

音声認識速記官の仕事を奪った時、私は声を上げなかった

AIデータサイエンティスト仕事を奪った時、私は声を上げなかった

俺は常々言っている

働かざるもの食うべからずという価値観の転換が必要だと

この詩の最後の句は

皆働かずに暮らせるようになった

で〆ようではないか

転職エージェントが教えるデータサイエンティスト採用難易度

ここ1年位でデータサイエンティストやら機械学習エンジニアやらの募集死ぬほど増ててどこに転職していいか迷っている人が多いみたいなの応募の参考にどうぞ。

自分情報を持ってる会社だけを対象です。正確な数値はなくて肌感覚です。

Sランク:突出したスキル経験・実績が必要

グーグル、PFN


Aランク業界である程度名前が知られているくらいの力が必要

DenaLINEリクルートメルカリ、グノシー、

PKSHA、Sansan、クックパッド


Bランクハイレベルからそこそこの人まで幅広く採用

ヤフードワンゴサイバーエージェントブレインパッド、アルベルト

モノタロウ三菱総研本田技術研究所外資コンサル会社


Cランク一定以上のスキル経験があれば普通に受かる

ファーストリテイリングKDDIソフトバンク、Speee、コロプラ

中堅ソシャゲ会社、中堅Web会社


Dランクジュニアクラスでも結構受かる

CCCDMM、DATUM STUDIO

2018-02-23

anond:20180119015621

増田がなぜそんな環境が整っていない会社に行ったのかを私は知っている。データサイエンティスト年収環境反比例するからだ。WEB系のようなデータサイエンティストがたくさんいる所を程年収が安いし、事業会社のようなITに疎いところほど高い。

相場データサイエンティスト環境が整ってるDenaLINEメルカリあたりのイケてるメガベンチャーで800万円くらい。EXCELデフォルトみずほ丸紅で1300万円くらいだと思う。

でも金に釣られるとろくなこと無いってわかっただろうから次はちゃんとした会社を選ぼうね。

https://anond.hatelabo.jp/20180119015621

データ分析の成否が事業の成否に直結するような会社を選べよ

まず戦うフィールドが間違ってる。

予測モデルの精度改善がそのまま売上の改善につながるような業態会社を選ぶんだよ。

そうすれば元増田みたいに冷遇はされない。

例えばGoogle.

Googleでは売上の90%が広告収入から上がっている。

ここで言う広告とは、GoogleやらYoutubeやらに訪れたユーザーデータを詳しく分析した上でもっとコンバージョンレートが高くなりそうな広告予測して表示するタイプ広告だ。

「誰にどんな広告を表示したらもっとコンバージョンレートが上がるか」というのは、当然データ分析機械学習範疇だ。

想像してみてほしい

1. 毎日GoogleとかYoutubeかに何億人だかのユーザーが訪れる。

2. 世界トップクラスデータサイエンティスト達が作り上げた、Googleコンバージョンレート予測モデルもっとユーザーコンバージョンしそうな広告予測して、それを表示する。

3. 予測モデルがはじき出した結果が正しければ、ユーザー広告クリックし、広告主は収益を上げ、その一部がGoogle広告費として入る。

この時、2.の予測精度が1%上がれば、Googleの売上はそのまま1%上がる。

Googleの年間売上が1〜2兆円くらいだったはずだから、1兆円の1%としても100億円の売上向上という事になる。

そういう企業データサイエンティストは、絶対元増田のような仕打ちを受けない。

逆に、データサイエンティスト末永く高い生産性を発揮できるようにあらゆる努力が行われているだろう。

Googleじゃなくてもこういう事業構造を持った企業では絶対データサイエンティストは軽んじられないと思うぞ。

だって、そうした方が儲かるから

広告以外だと、例えば保険業界のアクチュアリーとか金融業界のクオンツなんかも事業継続収益に直結するから良い感じなんじゃないか? 知らんけど。

入社する会社の事をよく調べろよ

あのさ、「R/Pythonバリバリ分析しようと思ってたけど入社したらExcelしか使わせてもらえませんでした」って転職先の下調べ甘すぎだよ。

プログラミングというスキルに対してどういうスタンスを取ってるかって、企業によってぜんぜん違うぞ。

元増田会社みたいに「プログラミングスキルコモディティ化したスキルで全部外注に出せばいい」みたいなスタンスを取ってる会社だってごまんとあるし、そういう会社に入ると悲惨なことになるぞ。

ちゃんと、転職エージェントから転職先の情報聞いたか? 転職先の会社ミスマッチが起きないように入念に面接を繰り返したか? Vokersは読んだか?

転職エージェント転職が成約すると報酬が入るようになってる事が多いから、話半分で聞いたほうが良いとは思うが、それでも元増田レベルミスマッチは指摘してくれると思うぞ。

面接人事部門だけでなく、所属予定部署マネージャークラスとか同僚になる可能性が高い人と面接させてもらって相性が良さそうかよく確認するんだよ。

Vokersは安いからとりあえず読んどけ。

まず信頼を高めてから本丸に切り込むんだよ。

データサイエンティストって基本的に物凄く"か弱い"職種なんだよ。

エンジニアみたに実際の製品を作る訳じゃないし、営業みたいに客が取れる訳じゃない。

データサイエンティストバリューを発揮するためには、自らの成果を他の職種理解して貰えないとダメなんだよ。

Googleみたいに作ったモデルが直接プロダクトに組み込まれ場合は別な。

じゃあ、どうすれば他の職種から理解して貰えるかというと、これは難しいところだな。

僕も分からん

ただ、1つ言えるのは、他の職種から信頼してもらえなければデータも出てこないし、分析した結果に耳を傾けられる事もない。

から、信頼して貰うというのは、必要条件ではあると思う。

信頼を得るためには、まず相手KPIを満たしてやる事だ。

組織ってその内部にいろんな評価基準を持っている。その評価基準は必ずしも全体最適になってないかも知れない。だから無視したくなるかも知れない。

でも、まずは相手が持ってる評価基準合致するようなバリューを出して、協力を取り付けるんだよ。そうしないと話が進まないからな。

既存評価基準の中で十分な成果を出したら、発言権が増すからそうしたら次は増田の好きなようにやればいい。

まあ、これをするのが面倒なら、最初からデータサイエンス事業に直結してる会社に入ると良いと思うぞ。

まとめ

というわけで、元増田は、

1) 転職先の候補となる会社の選定がヘタだった。

2) 選んだ会社入社する前の下調べが不十分だった。

3) 入った後の進め方も拙かった。

良かったな。改善余地がいっぱいあるから、これ直すだけで次は相当ハッピーに働けるぞ。

2018-02-10

ITエンジニアエンジニアだけどエンジニアITエンジニアじゃない

エンジニアITエンジニア。これを当たり前のように書いてるブログサイト多すぎませんか?

偉そうな事書いてエンジニア代表みたいな顔しないでほしい。

機械系や電子系、さら機械系のなかでも制御系や機構など、細かい分類がたくさんあるんですよ。

サイエンティストときはちゃんと"データ"サイエンティストだのなんだのつけるのになんでエンジニアだとつけないんだろう。

2018-02-03

anond:20180203102527

よく内容見てない(見る必要もないと思ってみていない)けど、こういうものに近い立場からすると、こういう病院比較みたいなのはやってほしくないことの第3位以内に入ることなんじゃないかな。特に統計家やデータサイエンティスト数字見て専門的なことならべて、一般の人が結論だけ見てしまうってやつ。

出来るけど出してない統計の裏に何があるか、専門能力がある人なら考えてほしいものだが。

出していないっていうのは隠しているとかではなく背景の違いがあって出すに相応しくないってことで、そこを数字こねくり回して無理矢理出すものではない気が。

2018-01-19

事業会社データサイエンティスト 会社退職しました

元々コンサル会社から事業会社のほうでデータサイエンティストをやるようになって1年経つが辞める。そのきつかったことを匿名という場所卑怯ながらも話したいと思う。

元々私は大学院でそこそこ統計をやってきてからコンサル会社に行きデータサイエンティストとして事業会社へ移った口だ。

根本的にデータサイエンティストとしての資質としてざっくりいうと以下の3つが必要だと思われる。

1. 統計能力関係及びそのプログラミング可視化能力

2. KPI設計及び事業からKPIへの落とし込みからそのKPIからどう事業繋がるかというビジネス設計能力

3. 上を基にしたコンサル能力

能力的には1がやや強く、その次に2がまぁまぁそして3はまだまだといった所で事業会社データサイエンティストとして孤軍奮闘をすることになった。

 入社理由

データはあるが、なかなか活用できていないこともあり、分析から企画から関われるという事で入社しようと思った。

後そこそこ大きな会社で働くのも良い経験と思い入社を決意した。ニッチな分野ではあるが、この分野ではTopカンパニーである

 実際の業務

最初の4日ぐらいは会社研修とかで潰れるのは仕方ないもので、それが終わり早速の業務を行う事になった。

まずはデータ各部門に依頼してから頂くのだが・・・

貰えない。

許可申請関係で3週間程かかってからまず最初データを頂けるようになった。この時点でやる気を削がれた。

更にデータ確認という事で事業へのヒアリングを進めるだけで・・・6週間程かかった。更にやる気を削がれた。

この辺りで気付いた事だが、コンサル会社でいたときは、データ確認がスピィーディーだったのに何故こんな遅い作業なったかというと

日本企業部署跨ぐというのはとても大変で、コンサルとしてやっていたときは単価も高いし、期間内でやらないといけないという事で

いろいろと調整がスムーズに進んでいたという事がこの時に分かった。コンサルとして外から見ているとやはり分からない事は多い物である

分析ツールエクセルだけ

データ確認も終わり、分析をし、改善を行うテーマを決めて進める事になった。この時点で2カ月ぐらい過ぎていた気がする。R/Python自分パソコンへの許可申請を出すが、降りない・・・会社的にはCならばOKだと言われる。でもCの追加ライブラリー関係ダメらしく・・・悩んだ結果エクセルを基に分析をする事になった。現状把握のために基礎集計をするが、エクセルSQLで言うGroup_byやら違うデータ同士をくっつけるためのJoinを32 bit エクセル関数ベースでやると何度も落ちる・・・。この時点でやる気は地の底へと落ちていた。

この辺りでCベースでもう書き直そうかと悩むが、流石にCのライブラリーがない所でフルスクラッチ調に書くのは工数的にかかると考えたのでvbaを用いていた。

エクセルベースでの可視化から上司関係者データ分析の結果を見せていく。この辺りでデータ分析から改善策はまとまっていた。しかしこの辺りでやる気をマイナスにして頂ける言葉を伺う。

私がVBAを書いているのをちらっと見て

プログラミング何かやっていても仕方ないし、プログラマーではねぇ・・・。今後会社ではプログラマーなんていらないか企画できるようにならないと」

勿論これは直属の上司からのお言葉ではないが・・・正確には同期である・・・もはや殺意すら覚える。因みにこの人の既存サービスの改良プロジェクトが回った時のデータ収集したら分析する事になっていたが、プロジェクトスケジュール感を見ると

要件定義 2週間

画面設計及び機能設計 3カ月

開発 4カ月

単体テスト・移行テスト 5カ月

運用以降

みたいな形でうん?何か少なくないか?と思ったら既存サービスに関してのギャップ分析無しに既存サービスの改良を進めているらしい

・・・その上取れるデータは〇〇〇で〇〇〇は無いらしい。あっそんなん改善出来んやん・・・。一応私はアリバイ工作のためにメール会議にて発言する

・・・空気を読めないと言われ会議呼ばれなくなってしまう(因みにこのプロジェクト要件定義から運用以降まで外注である)。

最早これは逃亡しかないだろうと心に固く決めてしまう。

私のコンサル的な能力がなかったと言えば確かにその通りである。でもいやうん日本企業の中で、分析をやっていくのは本当に難しいというのがよくわかる。

一人だったというのもある・・・でも殆ど基礎集計レベルで難しい用語を使わず改善を行おうとしたいやでもこの日本企業では無理だった。そしてやりたいと思わなかった。

たまに日本企業でのエンジニアの不遇差を嘆く記事を見かけるが、割と同じようなパターン臭いがする。

2017-12-08

ビットコインは何故失敗したのか

仕組みとしてはコンピューターサイエンティスト的な観点からもよくできてるし、仮想通貨って便利でいいと思ったんだけどなあ

まだ人類には早すぎたとか?

2017-11-23

UXとかデータ分析とかその辺の勉強の仕方

仕事柄、UXとかデータ分析とか、その辺が少し強いと思われているらしい。

職場の人からその辺の勉強の仕方を聞かれたので答えようとしたら、意外と長くなりそうだったのでメモがわりに書く。

これを書いている人のスペック

UX勉強方法とかの話

そもそもUXという言葉流行りだしたのは最近の話だと理解していて、バズワードに近いと思っている。概念自体は遥か昔からあるものだし、何を今更世の中がUXというワードを使いたがっているのかが良くわからない。(が、ここでは面倒くさいので、定義曖昧UXという言葉で色々お茶を濁す

また、UX勉強するという言葉も、正直なところ違和感がある。

というのも、具体的なケースと紐づいて考えない限りは意味がない気がするからだ。文章批評ばかりしていても小説家になれないのと一緒で、UXについて本や講義だけで勉強していても、UXに強くなることはないと思っている。つまり自分たちが作っている(関わっている)サービスの中でUXを考えつくすこと自体が、一番の勉強なんじゃないかと思っているので、UXを本や何かで勉強するというのは効果は薄いんじゃないかと思っている。

はいえ、体系化出来るメタスキル的なものがあるのは事実だし、その部分の話を書いてみる。

UXを良くするって何にきちんと答えられるようになる

UXを良くしたい」という話をよく相談されるのだが、そもそもとして、UXが良くなった後の世界をちゃんと考えられていないことが多い。

「そのサービスを使ってユーザ幸せになるの?」という問いにきちんと答えられない場合黄色信号という印象。

UXUXってバカみたいに唱えている人はたくさんいるけど、自分たちサービスUXが良くなることでこんな世界が実現できるよっていう話を、具体的に、鮮明に、誰が聞いても腹落ちする形で話せる人ってどれだけいるのかな。UXを良くしたいと言っているのに、良くした後の先世界イメージできていなくて、どうやって良くしていくのか甚だ疑問なんだよね。

なので、UXを考えるにあたっては、「自分たちがどうしても叶えたい世界」があって、それが叶うことによって「世の中の誰かがすごく幸せになる」という確信必要条件だと思ってる。なので、そこがない時点でUX改善どころかサービスを作ること自体をやめた方がいい。

もし、そんな感じの祈りにも似た思いが少しでもある場合は、自分たちが作りたい世界についてしっかりと考えて、そしてそれらを検証して確信に変え、具体的な言葉に落とし込むというプロセスを徹底的に行うことを、UX改善の前に行なった方が良い。そうやって生み出された言葉が、UXを考えるにあたっての拠り所になる部分になっていくから

ユーザを観察して想像し、検証する

自分たちが作りたい世界言語化できた後は、ユーザの観察と妄想に尽きる。

課題解決系のサービスなら、ユーザに当たる人が本当に困っているのか、何に困っているのかを見極めるために観察すべきだし、何らかのバリューを付加するサービスなら、「このサービスを使ってもらうことで幸せになるのかという妄想」をいかに具体的にできるかが鍵になる。

これらの観察および、具体的な妄想をしていくこと自体UXを考えることである

炊飯器が目に入ったので炊飯器UXを考えるとした時の例で話す。

多分、こんな妄想をする。

炊飯器とか既に他の製品存在するものは、ユーザの行動もだいたい想像できるし、何より自分が使うものから妄想やすい。

逆に、全く新しいものを作ろうとする時なんかは、妄想も中々大変だと思う。バイアウトして話題CASHとかは、その辺りの参考になるものが中々なく、妄想もやり辛かったと思うので、それを形にできたUXデザイナーの人はすごいなと思う。会ってみたい。

もちろん妄想だけだとダメで、そのあとに検証が入る。

これはかなり適当に書いたが、自分たちが行なった観察に基づく妄想に対して、それらが意味のあるものかどうかを見極めていく必要がある。これがいわゆる価値仮説の検証と呼ばれるもので、妄想が本当に必要とされるものなのかを見極めるフェーズである必要とされないものなんて作っても意味がないから、この段階できちんと仮説の検証をしておく。検証については対象によって全く異なるため、都度考える必要があるので割愛

例はかなり適当に書いたが、ユーザをしっかり観察して、その上でどうやったら幸せになるかを妄想して、それらを検証していくというフェーズを、手抜きせず行うことが大事だ。これが業務系のサービスだと、業務フローを作ったりするのだろうし、C向けサービスだとカスタマージャーニーなんかを作ったりすることになる。その辺りの手法は色々あるが、ユーザを見て、考えて、検証してという基本はどれも変わらない。

観察結果をもとに解決策を生み出す

ユーザをひたすら観察したあとに、初めて解決策を考えるフェーズに移る。

解決策ありきのプロダクトだと(昔の技術先行型の日本家電だけど)、あまりいい感じにはならない。

あくまでも、ユーザの観察が先にあって、それに対する「解」としてプロダクトを作っていく。

この、課題に対して適切な解を出していくこと自体が、UXの磨き込みに当たるという理解をしている。

そして、それらが部分最適にならないよう、全体最適意識しながら解決策を考え、プロダクトに落とし込んでいく。

「ご飯は1分で炊けるけど、風呂釜より大きい炊飯器」とか、誰も必要としないよね。だけど、部分最適だけを考えるとそんなことになりがちである。そのためにも、部分を考えたら、全体を見るということを繰り返し行なっていくことが大切だと感じている。その意味では、捨てるべき部分と、活かすべき部分のバランスをどう取るかが大切になる。ここも結局ユーザが教えてくれるので、事前にしっかり観察できていれば、勝手に答えが出る。

小括

長々と書いたが、自分たちが作るサービスを使ってくれる人たちが、「どうやったら素敵な感じになるかを考え尽くすこと」が最高の勉強方法だと思っている。なので頑張って考えると良いと思う。

はいえ、何を考えればいいかからないということもありそうなので、その時は

・誰のためのデザイン

・複雑さと共に暮らす

・融けるデザイン

あたりを読んでみるのは良いかもしれない。少なくとも、何かを考えるにあたっての視野は広がるような気がする。

また、解決策を生み出していくにあたっては、ロジカルシンキングが出来るに越したことはないので、

・考える技術・書く技術

ライト、ついてますか

あたりを読んで見るのも良いかもしれない。後者は分類的にはロジカルシンキングの本ではないのだが、ロジカルに考えた時の解決策って一つだけじゃないよねということを身を以て知るためには良い本だと思う。

また、散々書いたが、UX云々の前に、自分たちが作っているサービス(だったり、炊飯器だったり椅子だったり)で「何を届けたいか」という部分が一番大事だと思う。それ抜きにはUXがどうとか議論するのは無駄というか、意味がないので、しっかり考え抜いてほしい。

データ分析勉強方法とかの話

なんかめっちゃ長くなったが、続いてデータ分析の話を書く。

データ分析というと、Pythonごにょごにょやるのがそれだと思われがちだが、一部のデータサイエンティストを除いては、基本的スプレッドシートで十分なんじゃないかと思っている。むしろ電卓レベルでも足りるんじゃないかという気がしている。(ここで話しているのは一般的インターネットサービス運営していくときの話で、気象予報とか経済予測とかそんな感じの難しいデータ分析の話ではない)

というのも、多くの場合において、四則演算以上のことをしなくてもなんとかなるからだ。

どちらかといえば

といったことの方が大事だし、そもそも「何のために分析するか」が抜け落ちていることが多い。

whyの部分が明確でない分析そもそも意味がないので、まずはなぜ分析するのかを考えるところから始める方が良い。

データ分析ときいて「統計学」や「Python」を勉強すること自体は悪くないのだが、それよりもまず先に、「なぜ分析するのか」「どんなデータ自分たちサービスキモになるのか」といった分析の前提になる部分をまずはしっかり見極めることの方が、統計学勉強よりも優先されるべきだ。それらがハッキリすれば、手法はいくらでもあるし、だいたいはスプレッドシート関数でなんとかなるので、難しい計算特に必要ない。

実務でよく使うデータなんて、売上、利益利益率、ARPUCPACTRCVCVRとかくらいだし、これら全て四則演算のみで出せる。分析といっても、平均だったりそれらをユーザ属性で割り振ったりするだけだし、中学生でも問題なく出来ると思う。ただ、重ね重ねになるが、whyの部分がない場合はいくら分析しても何も生まないので、まずはそこを見極めることに重点をおいた方が良い。

まとめ

長くなったので無理やりまとめる。

勉強<<<<<実務であることは間違いないので、まずは自分が関わっているサービスについて真剣に考えたり、真剣に考える上で必要数字が何かを自分の頭で考えることが、最高の勉強だと思う。教材とか、具体的なHowを期待していた人、ごめんなさい。でも、Howの意味で見ても、実践に勝るものはないと思っている。

2017-11-22

メルカリ個人情報取扱って本当に大丈夫なの?

世界最大のデータサイエンティストコミュニティ「Kaggle」において 機械学習コンペティション「Mercari Prize: Price Suggestion Challenge」を開催 | 株式会社メルカリ https://about.mercari.com/press/news/article/20171122_kaggle/

メルカリデータサイエンスコンペティションやるってそれユーザーから集めたデータでしょ?

商品タイトルとかカテゴリーから特定個人に行き着いたりしないの?

そもそもそれユーザーが出品したり投稿したりしたデータじゃん。

なんでユーザーに事前に通知もなく勝手にそのデータ使って、しかも誰でもダウンロードできる形で公開してコンペティションとか言ってんの?

せめて通知くらいしてくれないとサービスとして信用ならん。

2017-09-14

同じプログラマでも違う

2017-06-27

https://anond.hatelabo.jp/20170627221437

気づけて良かったじゃん。

大学院とか、自分サイエンティストとしての限界を知るためにあるような場所だよね。

僕はマスターで「あぁ、俺ってあんまり頭良くなかったんだ」と自覚した。実感した。

頭が良いこと(論文理解することだったり、研究計画を立てて実行して論文を書くことだったり)

は、人間の様々な才覚のうちのごく一部であることを今は知ってる。

から何ってわけでもない。 みながプロ野球選手になれるわけじゃないことに似てる。

妄想です

ZOZOTOWNメルカリと内容は違うが大手ECサイト最近問題が起きている。

http://tech.mercari.com/entry/2017/06/22/204500

ここでメルカリエンジニアの方が原因を説明しているが、とても単純で御粗末な内容である

ZOZOTOWNは毛色は違うが、前から結構酷い作りのサイトらしいし、求人も出していた。(とても求める人材が来るような給料では無かったが…)

この2社に共通しているのは社内での技術者立場の弱さではないだろうか?

もちろん全ての技術者に冷ややかな目を向けているわけでは無く、今花形データサイエンティストなんて感じのビックデータ統計分析する人々は社内でも一目を置かれていそうだが、そうではないネットワークシステム管理運営をしている日陰な役割エンジニアに関しては、余り良い待遇を貰ってはいないのでは無いか

経営者陣が技術者軽視だと、自然予算人員も割かれず、少ないマンパワーで大規模なネットワーク保守をする事となり、並行してリプレースに向けての準備やテストを行ったりしているのではないだろうか。

そして発言権も無いに等しいので、万全を期して一時的システムアクセス出来なくする事も許されずに、切り替え作業実施させられたのでは無いか?出来るか出来ないか?の2択で問われて、嘘は言えず出来なくはないと答えざる得なかったのではないか

メルカリ自体当事者というより被害者立ち位置で、

と言う感じの回答を土日でかき集めたバイト社員名乗らせて答えさせている。

今回の件について対応の是非は分からない。きっと問題直後の動向を社内のデータサイエンティスト分析して、メルカリユーザーは気にせず使ってますって事で強気GOでも出したのではないか

でも、技術者をないがしろにしていると、いづれ第2第3のポカミスをするだろう。まぁ、その時は求人サイトに安い給料奴隷募集を恥ずかしげもなく出すのであろう。

妄想です。

2017-01-06

[][] @Idesan Tsuyoshi Ide (井手 剛)

2016-12-09

小保方晴子村田マリ、あと規範意識について

時の人である村田マリ氏については、会ったこともなければ分野もぜんぜん違うのですが、小保方氏とは分野も近いし所属的にも近いです。

ある記事ブコメに、村田マリは小保方と近いのではないかとありました。なるほどその観点はわかりやすい。

小保方氏が結局何をしていたかというと、ミーティングなどでのボスの反応を基準としてプレゼンテーション作成し続けていたということ。だから、直属のボスには非常に評判が良い。ボスの反応がよくなるような材料を作るためには、サイエンス規範に逸脱することを厭わない。だからボス以外の同僚からは評判が悪いし、論文としての科学界での評価は最悪です。最終的に彼女の才能は、国民の反応をポジティブにするような記者会見で最大限発揮されたものの、サイエンス相手にしたというのは彼女にとって分が悪い勝負でした。サイエンスを敵に回すというのは、世界を敵に回すのと同じことですから

それで、ギガジンとかの村田マリ氏への罵詈雑言めいているが一面の真実を含んだ記事などを見て、かつ上記ブコメを参考にすると、要するに村田マリ氏はPVとかの反応だけに合わせてwebメディアを作ったということでいいのですかね。メディアとしての規範無視して。盗作など法律的問題もいろいろ騒がれているけど、結局のところ最大の問題は、「一部上場企業が、医療などの情報について誤った記事を、PVを稼げるからというだけで作成してよいのか」という、やっぱり規範意識問題だと思います

さて、サイエンスとの勝負で小保方氏は敗北を喫したが、メディアとの勝負村田マリ氏の勝負はどのように決着するか、注目しています

ところでやはりこの両者に通じるのは、端的に、規範意識の欠如ですよね。高度に発達した社会であり、犯罪率も極めて低い日本のような国において、相対的貧困などと同じように、やや見えにくいが確実に社会ダメージを与えているような事柄なのだと思います

そしてこれは、確かにこれまで学校教育において規範意識教育、これはあまりなされていないと思います。では新しい道徳教育はこれに一石を投じることはできるのか?リベラルサイエンティストである私は、不安を感じるところが大きいのが確かですが、しかしなにもしないというのは、第二の小保方、第二の村田マリが今後も出現し続ける未来意味するのであって、それはあまり私の期待する社会ではないです。

2016-10-10

データサイエンティスト年収レンジ

大手ネット企業だとこんなもんかな。

R社 700〜1000

Y社 500〜750

D社 700〜800

D社 550〜700

C社 650〜850

M社 500〜700

S社  600〜850

2016-10-09

http://anond.hatelabo.jp/20161009233332

逆に言うと出来合いの理論を使ってツールを作るのがエンジニア

理論を開発するのがサイエンティスト

俺の中で理学系と工学系のどっちが偉いかバトルが始まったので

とりあえず両方の肩を持っておく。

アーカイブ ヘルプ
ログイン ユーザー登録
ようこそ ゲスト さん