「統計」を含む日記 RSS

はてなキーワード: 統計とは

2018-04-26

データサイエンティストが働いて嫌だったなと思う人たち

コンサルにてアナリストをやった後、データサイエンティストを名乗りながら仕事をしています。そんな中で嫌だったなと思った人たちとプロジェクト

1.医療統計の周りの人

最近アウトカムでの評価の流れにはなってきたが、まだまだモデル評価をする事は少ない。

でも何故か相変わらずロジステックとCox回帰をやれればおっけーであり、モデルの精度が当たらなくてもオッズ比と説明変数

有意差だけでていれば上手く行く分野。 本当に心が痛む上、まだまだ「医者でなければ人であらず」が通ってしまい、モデル説明よりもお医者様のお言葉が1stにきてしまう。また分析プロジェクト

設計らしい設計があまり出来ないのもつらいところ(モデルの精度が出ていないのにそのオッズ比・有意差に何の意味があるんだと思う)。後日本の製薬企業から「何とか工夫で有意差がでないのか!!」

という謎おしかりを受ける・・・いやそんなん無理ですやんと切実に思う。やる気でこの世界数字は変わりません。

後は何だかんだ製薬企業日本の古いしきたりが多いので面倒。

2.Google Analyticsアナリスト関連

割と良いBIみたいなんが良くも悪くもあるためアナリストの人たちがやった気になっているやつ。Web関係アナリストは、アナリストを名乗って欲しくない人の方が多いイメージ(勿論しっかりWebアナリストやっている方々は知っている)。

勝手広告内容を分類し、CV予測、そしてマルチチャネル予算からCV最適化案件をしていたらWebアナリストから「私の作るLPは最適です。なので予算4000万です」という謎の最適の主張を受けたのはいい思い出(何故かデザイナー様がWebアナリストもやっていた)。広告内容のuser2vecでのレコメンド実装チャレンジして評価して、協調フィルタリングよりも精度はよさげだな喜んでいたら、どっかのよくわからないレコメンドツールというのが汎用性もあるし、既存ツールに1万ぐらい払えば追加できるとそして何故か「最適化」されているという言葉役員が騙されて決済がおりていたのを聞いたとき殺意が沸いた。どうせ既存マーケティングオートメーションレコメンドエンジンなんて協調フィルタリング・ロジぐらいだろうと思っている。本気で分析やっている人がそうそ最適化なんて言葉を使わないと思うんだ・・・まぁここの反省Web業界といってもみんなコーディングがりがりではなくてGUIでいいならそれでが割と多いという事を学んだ*。

3.データベース関連

どっかの人のにもあったが、「あっ、データ分析分かるんだよね?」という事でVB6Accessの改修をやらされそうになったときは全力で拒否った。

後は何故かPHP+MySQLあん(ry

VB6見た後でPythonコードを見ると心が癒された。

4.やる気を説いて来る人達

やる気で数字が変わったら誰も苦労なんてしないんだよ・・・。半教師有り等で精度向上見込めるといってもいくらなんでもこのデータでは

運用目標には到達しないとしか思えないんだ。

5.ホワイトボックステスト要求されたとき

モデルホワイトボックステストってどうやってやるんだ?精度を検証データでやっていれば良いじゃないかと思っていた。ただそこの金融系でITプロジェクトは、基本的に「ホワイトボックステスト」やらが必須らしく・・・おいおい・・。とりあえずカテゴリー目的変数がそれぞれの値を取ることを客先で見せてかつレポートで「こうこうこうゆうときカテゴリー変数が変わりますよ」という彼らがいう境界線確認を全てやることになった。カバレッジ100%も言われたが、流石に無さ過ぎるので諦めてもらった。

因みに私の別部署インフラ基盤周りのWordpress関係炎上していた。


勿論これの逆、評価した上で、分析ビジネスにしっかりと生かしていける人は大好きです。

2018-04-25

hagex勉強会に行ってきた

ハゲ子を見てきた

想像通りのアラサー女でアシスタントが禿げたおっさんだった

勉強会としてはイマイチ

炎上度数指標を数値化したいとのことだったが、

はてなブクマ何個で10点など単純すぎて微妙

もう少しメディアごとの重みがーとか、広がる範囲と弱火、強火と言っていたが

縦軸と横軸をはっきりさせて例えば発生から日数毎に何日目に何PVのように

今日までの統計でなくもう少し解析的に突っ込んだ話が聞きたかたか

仮説立てて評価作ってみたいな理系ゼミみたいなのを勝手想像して行ったら違った

聴講マナーについてたが発表者が発表している時は静かにしよう

質問や補足があるなら質問タイム

hagex読者なら言わんでもわかるだろってのと、仮にも勉強会なんだからその場で調べるなりしろよと

今回は時間的に厳しいがもう少しこまめに質問タイムがあってもいいかもしれない

逆に対話形式面白そうなのでそういうのは少人数で飲み会(スタンプ特典)とか

業界裏話的な方が盛り上がってた

時間場所関係参加者ほとんどhagexファンですみたいなキラキラ女子サブカルクソ女って感じだったので

ガチ目のおっさんは浮いてた。さすがカリスマ女性ブロガーイベント

行ったことないけど阿佐ヶ谷イベントみたいな方をもっとやった方がいいのかも。同じ内容でいいから何回かやってほしい

anond:20180425114822

そうですね

私はもともと「差別差別」という立ち位置ですから

統計とかエビデンスとかの話をしていたのは別の人では?

anond:20180425113923

ようするにそれでも「差別差別だ」と言うわけですね

ということはエビデンス統計問題ではないですね

anond:20180425102515

統計鉄道会社がとっているところかもね

結果次第であなた女性専用車両容認するわけですか?

anond:20180425101727

いか世帯年収950万が中の下かどうか統計確認しろ

都内の」「23区内に住んでいる」「共働きの」「大学生くらいの子供を持つ」「子供レベル高い大学に通っている」

なんて条件をつけていったら東大生の親に近づいていくに決まっているだろう。

anond:20180425095225

気になるなら東京都統計見ろや。自分が間違ってることが一瞬でわかるぞ。

anond:20180425095225

いま40で400とか普通だよ

大卒男子平均が650程度あった時代客観事実な感じの統計だったけど今は怪しいもんだ

anond:20180425023409

長すぎたので、最後の部分を分割。

余談

 とある、それなりに言動については信頼しているSF小説家が、ずいぶんと今回の件について批判的な言及をしていた。そのずらりとRTされてたり自分キータッチで語られたツイート群の中には、オタク文化が、特にここ15年くらいの間は、差別的言動や行動をよしとするようなものを内在していた、ということについて気にする形跡は、一ミリもなかった。その当事者ゼロっぷりに、普段かなり反差別に近いツイートもしている人だが、ようするにそれは「「自分たちの世界」の外側で起きていること、アニメを見ながら実況ツイートしているような扱いなんだろうかな、と考えるととても残念な気分になった。敢えて、実名は上げないけれど。

 話はそれるけれど、この小説家氏は、自分の仲間たちがかつて、とあるパソ通フォーラムリンチしていた一人の参加者からその当時のことについて非難をされたとき、「あかん、こいつほんまアホや」と語り、それについて問いただされたら「おかしいことをおかしいと言って何が悪いんだ」というようなことを言い出した人のはずである。なぜ、そんなにC.R.A.C.の「それは差別ではない」発言に怒れるのかちょっと謎ではある。

 それにしても、こんなツイートRTしていたのには呆れてしまった。

https://twitter.com/kanenooto7248/status/987141171083227136

 一人残らず!

 そこまで言うからには、もちろん、一人残らずそうなった、という統計があるはずだろう。しかし、そんな資料が上がっている形跡はないしそもそもそんな統計はないはずだ。おいおい、トンデモあなたRTしたいものの中にあるんじゃあないのか? だいたいこの発言主は俺とそう年が違わないはずで、そんな俯瞰的調査をするべくもないはずである

 この小説家氏に限らず、これをRTしているのを見かけた人の相当数が、オタクをひとくくりにして批判されることを蛇蝎のごとく嫌っていた。でも、こうやってひとまとめにされることは嫌ってないどころか大歓迎のようだ。

 この小説家氏以外にも、何人か、この件で言及しているクリエイターを見かけた。クリエイターオタク出身が多いだろうけれど、しかし一人残らず、とまで言えるかは微妙であったけど、相当数が表現差別性をめぐって議論が持ち上がるとほぼ確実に「そんなのどうした」と切り捨てる側に立っていた人たちばかりである。それ以外のことでは割とリベラルな態度の人でさえそうである。そういう人が、「あれは差別でないなんてけしからん」「あらゆる差別をいけないといいたい」「自分の気づかない差別について提起されたらどんどん理解していきたい」などと言っているのだ。それはあなたが、フェミニズム運動家などの言説に対して取っていた態度である自分で気づかないのだろうか?

 余談ではあるが、後者の主張はすごい正論のように見えるが、相対化に明け暮れて問題点を覆い隠す格好のツールだ、と思う。こんなことを言っている人は、そのうちにあん差別こんな差別と言い出した末にポリコレ疲れだと言い出す。このダイソーで買った商品名不明電卓を賭けてもいい。2ch(当時)の人権板は、あらゆる差別をなくすための場だという名目で、部落差別の復活や地名晒しを行っていた場だった。

 こんなていたらくの上で、オタク差別性については雑だ雑だとケチをつけるツイートRTしていたりする。そしてこの小説家氏はたぶん、相対的ちゃんとしている部類である

 そーいう閉塞感。

 あとこれはさらに余談。

 俺は野間氏は嫌いなんだけど、関わってる運動が形になることに関しては確かに上手いんですよね。

 どれくらい中枢でかかわってたのかとか知らんので「運動を形にする」とまでは言わんけど、例えばしばき隊を軸にしたカウンター反ヘイトスピーチ法に結実したし、SEALDs最近のあの手の運動としては異例の存在。反原連だけはよくわからない。自分あんまり反原発じゃないからかもしれない。

 そのへんのところは、ちゃんと考えた方がいい気がするんですよね。

 というのも、野間を嫌いなあまり政治的立ち位置が狂って行ったオタクな知り合い、って何人か目にしてて、そういう社会運動の現状ってよくないなあと思うんですよ。

 それまた閉塞感、というか。

2018-04-24

なんだか、やっと今年の目標が決まった感じ。残り、半年以上、9ヶ月ぐらい、頑張ろうー。

資格取るぞー。統計検定2級取ろう。

な? 俺が言った通りだろ

なお、自分に都合が悪いことに関しては「統計が無い」「定義不明瞭」「主語がでかい」で逃げ続けるもよう

なお、自分に都合が悪いことに関しては「統計が無い」「定義不明瞭」「主語がでかい」で逃げ続けるもよう

趣味就活武器にできるか

二次創作ゲーム趣味

理論的・体系的に面白い作品を作ったり勝ち方を研究をするのが好き

手段としてちょこっとエンジニアっぽいことはした(ExcelPython統計分析とか自動化とか)

どの界隈でも知ってる人は知ってるぐらいの立ち位置(どれもtwitterフォロワー数百ぐらい,自発フォローほぼなし)まではいけた

名義はバラバラでいずれもリアル名義に結びつけてはいない


これはITエンジニア就活武器になるのか

おとなしくリアル名義でなんか実績作ってアピるほうがよっぽど強いよなぁ

でも今まで累計10年近くつぎ込んできた趣味を捨てられない気持ちもある

まあ両方武器しろって話か……

anond:20180424134141

それな 標本っていうと大抵のジャップ昆虫標本しか思い浮かばない低知性

代替ダイガエと言い換える忖度が足りないんだよ統計齧ってる連中は

anond:20180424082940

かにヤバい

みんな授業まともに聞いてなかったのか

ってか今って統計の授業あるのだろうか?

母集団」の意味間違えてる奴多すぎ問題

わかってますよ風にドヤ顔ブコメつけてるのに間違ってるのは恥ずかし過ぎる

bushimichi そもそも新聞社の思惑で誘導尋問しまくってそれを世論調査といってることがねぇ。。。統計母集団正当性固定電話ネットでも大差ない。

netcraft3 層化無作為二段抽出法やRDDが必ずしもベストというわけではないけど母集団の偏りが少ないベター方法。標本調査理解せず数の多さだけ比較されても意味ない。

famnet 当然。母集団の偏り。数BかCでやらないか?というか、やってなくても常識的にわかるだろ感 https://ja.wikipedia.org/wiki/%E5%81%8F%E3%82%8A


仮に安倍政権に関する世論調査として3000人に調査をしたとする。この3000人を「母集団」だと思ってんだろ?違うよ!それは標本だよ!

母集団」ってのは調査したい集団全体のことだよ!世論調査であれば普通日本の全有権者だよ!

2018-04-23

anond:20180423182128

現に引き離せてないですやん。

女性女性専用車両という特権があるにも関わらず、一般車両男性不安を与えることをやめない。

男性は奪われてるだけ。

無くなったかどうかの話はしていない。

無くなってないなら、何の意味があるの?

差別行為主体となってる鉄道会社は車内トラブル現象統計すらロクに出してないけど?

なんで効果があるか無いかも分からない差別を、「メリットがあるかもしれない」などと有難がって受け入れないといけないの?

悪いけど、全く筋が通ってない。

2018-04-22

フェイスブック利用者幸福感が統計的有意に低いとか

電子書籍より紙の書籍のほうが学習効果が高いとか

このへんは不都合研究として噛み付かれ続けそうだな

別に統計なんか無視して好きな物使えとしか思わんけど

anond:20180422164836

統計等の根拠を示してそういう傾向はないと言えばいいだけだろ

人生ランキング作って欲しい

ただのゲーム感覚

 

多分総合では下位にいるんだけど

所得部門では上の方にいると思う

でも上位何割の位置かよく分からない

年収統計はよく出てくるんだけど、所得はよく分からないんだよね

とりあえず三年以内に同世代上位0.1%に入りたい、でも入ったかどうか分からない悲しさ

(全世代ランキングは相当きついと思う。年寄り連中がマジで強い。上位10%もまだ入れてない)

anond:20180421181429

無駄といった人じゃないが、普通に考えて、個々に書いてあることを見ても便所の落書き程度の意味しかないと思う。

自称男が男かはわからないし、自称女が女かもわからない。

実質何人が答えたかもわからない。

どこかの統計でも引いて説明してくれないと、個々人が意識しているとかしていないとかいっても全く意味がない。

自分は男だからとか、女だからというより、人によって安全に対する欲求の強さが違うんだろうなとは思ってる。

anond:20180422022941

ある種の統計上の「いわゆる医師」にカテゴライズされない医学部医学出身者の中にはパートタイム医師とかの他にも基礎研究医というのもあるし

特に問題になりそうなところでは、「MD持ち研究者」の中には医学教員系統とは全く関係ないところでやってる人もいるという事情がある。生命科学系統とか。

統計的分類による誤差とかが問題となるのならそのへんもあったりしないんだろうか

女医結婚できない」?

地方医学部女子学生は、男の医師部活の先輩に「女医モテない。」「学生のうちに彼氏見つけないと結婚できないよ。」「妥協大事だよ。」「お前は選ぶ側じゃない、選ばれる側なんだ。」というようなことを言われ続けて6年を過ごします。セクハラですが、地方医学部ムラ社会なので仕方がないと諦めていました。(社会に出てみて、これらがすべて嘘だったとわかりました。女子医学生はこんな言葉を真に受けないでくださいね!)

この根拠にされているのが、医師にはおなじみの「1/3ルール」で、女性医師の1/3が婚姻継続、1/3が結婚後に離婚、1/3が生涯未婚とされています。みんな言ってるこの数字ですが、「女医結婚できない」という趣旨サイト例外なく、舞田敏彦氏の職業別の生涯未婚率http://tmaita77.blogspot.jp/2014/02/blog-post_9.html)を出典としていました。おそらく1/3ルールもここからきています。よく見ると、本調査で「医師」としてカウントされているのは現役・フルタイムで働いている人のみで、出産を機に退職した女性医師、あるいはパートで勤務する女性医師統計対象外のようです。また、上記サイト資料として挙げられているのは「職業構造基本調査」のみですが、pdfに「医師」で検索をかけても1件しかヒットせず、数字根拠不明でした。他に参考にした資料があるのでしょうか?

1/3ルール数字を算出する時に女性医師出産で一時離職・パートで働くことが多い)が多く除外されているため、信頼に足るものではないと思うのですが…。

また数字算出の過程素人目には何と無く胡散臭いです、舞田氏は統計専門家のようですが…。

どう思いますか。

アーカイブ ヘルプ
ログイン ユーザー登録
ようこそ ゲスト さん