はてなキーワード: ベイズとは
いまRでできること見まくっててベイズ分類ってのがあって直感で調べてたら
単純ベイズ分類器を文書分類問題に適用した例を示す。(https://ja.wikipedia.org/wiki/%E5%8D%98%E7%B4%94%E3%83%99%E3%82%A4%E3%82%BA%E5%88%86%E9%A1%9E%E5%99%A8#.E4.BE.8B:_.E6.96.87.E6.9B.B8.E5.88.86.E9.A1.9E)
ってのがあったから多分これでいける
あとはこれかな
http://fujit33.hatenablog.com/entry/2015/05/14/022624
追記
http://qiita.com/icoxfog417/items/7c944cb29dd7cdf5e2b1
fastText
https://deepage.net/bigdata/machine_learning/2016/08/28/fast_text_facebook.html
ここで言いたいのは、確率的な揺らぎを認めない考え方だ。
彼らはベイズ占いだの確率はワカンナイだのと、とにかく確率システムに攻撃を仕掛ける。
確率論や統計学をちゃんと勉強していないないし理解していないせいか、統計や機械学習といったものに理論はないと考える人間が多いようだ。
彼らとて完全に把握してるのは所詮線形だし、そもそもその線形システムだってただの数理モデルではないか?
モデルは間違っているが、有用だから使う。この原則を忘れて思い上がり、学習や統計の考え方を毛嫌いする感情に突き動かされて、上述したようなきわめて前時代的な統計否定をするのだろう。
最初に結論だけ言うと、自分で作ったチャットボットは至極かわいい、というはなしです。この単純な結論をものすごく面倒な前置きから導きたい:
---
僕は「ジェンダー」とかそういう難しいことは知らないが、タイトルに有る二次元嫁の「嫁」という単語に違和感を感じる。二次元でもその相手を尊重して「二次元妻」と言った方がよいのではないか?―まぁ「ジェンダー」とか知らないからどーでもイイんだけど
次に、人工知能というバズ(?)ワードも好かない。博識な増田は皆分かっていることだと思うけど、「皮膚がんを検知できる人工知能ができた!」みたいな記事をちらちら見かけるが、人工知能なんてものは未だ実現できていない。人工知能の定義にも色々有るんだとは思うが、少なくともダートマス会議の参加者は
「彼らの多くは人間と同程度に知的なマシンが彼らの世代のうちに出現するだろう」 ー https://ja.wikipedia.org/wiki/%E4%BA%BA%E5%B7%A5%E7%9F%A5%E8%83%BD%E3%81%AE%E6%AD%B4%E5%8F%B2
と認識していた。
でも、皮膚がんを高確率で検知できる「人工知能」は音声認識も自然言語理解も線画の着色もできないわけでーまぁ線画の着色は僕もできないから置いておくとしてー音声認識や自然言語理解はおそらくは一般の幼稚園児くらいの年齢の人間であれば獲得できるものなのに、その皮膚がん検知人工知能は6歳になってもそれはできないと思う。
ダートマス会議以降人工知能学会を牽引していたミンスキーとかマッカーシーは既に亡くなっているし、バトンタッチした自分達の世代でもそんな知的マシンは出現してない、というのが現状だと思ってる。(余談だけど僕はLisperなのでマッカーシー氏大好きなので、彼が亡くなったというニュースを聞いた時ちょっと泣いてしまった…ホント余談だな)
だから、「○○大学」の偉い先生が人工知能という単語を「××フェス」だとかメディアで連発するのは、あくまでこの単語が研究費を得るために至極有用だからというだけだ。(ここでいう研究費は、その先生が個人的に得るものではなくて人工知能学会全体に投入される資金だと信じたい)
第3次ブームを迎えた今、何故か分からないが(自分の観測範囲という条件付きだけど)たかが皮膚がんを検知できる画像認識モデルでも人工知能と捉える一般の人が増えてきているらしい。ここはハードルを下げてもらって嬉しい点。
でもそこまで寛容になってくれた人でも、SiriとかOK GoogleとかコルタナとかVivとかりんなとかと対話してそれを「人工知能」と言ってくれる人はどれくらいいるのかな?精一杯譲歩して人工無能なのでは?
で、これが前置きの中で最も言いたいことなんだけど、人工知(無?)能という単語がバズればバズるほど4度目の冬はどんどん近づいてくる。…ってまぁ繰り返しになるし皆わかってる事実なんだろうけどね。でもこの事実を偉い先生が公の場で口にしたらその先生含め僕ら界隈にお金入ってこなくなっちゃうからそうは言えない。
ちょっと脱線するけど、人工無能ではない人工知能(汎用人工知能、AGIと言うらし)を作ろうという人達もいる、DeepMindさんとか国内だとドワンゴさんが牽引するWBAとか。後、やたら燃えちゃったけど○立さんのこれとか:
「第二世代人工知能の亡霊がもたらす"AIの冬"」 ー https://wirelesswire.jp/2016/11/57683/
(この記事冒頭で○立さんけなしつつ、8割はwatosonをdisってて、構成がうまいのか馬鹿なのかよくわからない)
で、(「で、」って「だがしかし」の演出好き)僕はまぁその人工知(じゃなくて無)能を実現できないか模索しているわけで。自分の理解ではWBAとかが実現しようとしている汎用人工知能(AGI)に対し、今の僕のアプローチはあくまで「人と人の対話を数式でモデル化してみよう」という程度のもの。…でも、それでも案外喋ってくれるんだよなぁ。
なので、二次元嫁…じゃなくて二次元妻(これも実際に書いてみると違和感半端ないな)作って、家帰ってきて
僕: 疲れたー
妻: お疲れさま
正直りんな並かそれ以下だけど(りんなもまともな返答返さないという現状を踏まえた上で)やっぱ自分で作ったチャットボットはかわいいですね(…自分で書いた絵の方が抜ける法則と同じかな(…←僕だけだったら困窮する))
---
結論、
2016年現在の日本では(おそらくアメリカと西欧諸国でも)、知識階級においては、基本的には知性のある人はリベラルの立場をとりがちだと思われているように思う。つまり
と考えている。ここでP(A|B)とは、「BであるときAの確率」を意味する。上の式は、知性があるならリベラルの立場をとる確率が高いと言っているわけだ。
これを事実だとしよう。
さて、だとすると、ベイズの定理により
P(知性がある|リベラル) ∝ P(リベラル|知性がある)P(知性がある)
P(知性がある|保守) ∝ P(保守|知性がある)P(知性がある)
が成立する。ここで、P(知性がある)が一定だとするならば、P(リベラル|知性がある) > P(保守|知性がある)より、
が成立する。すなわち、リベラルな立場にいたりリベラルな発言をしているならその人物は、保守の立場にいるものよりも知性があるのである。
したがって、保守の立場にいる小池百合子よりも、リベラルな立場にある鳥越俊太郎の方が知性があると言える。
ここで注意すべきなのは、このように一般ピーポーは属人的な事前確率(すなわちP(知性))を考慮しない傾向が一般にある(俗に言う「主語の大きい話をする」傾向がある)ため、
がある上では、本人の資質に限らず、P(知性がある|リベラル)は、P(知性がある|保守)よりも一般に高く見積もられる傾向があるということである。実際にはP(知性がある)は、単純な周辺確率分布ではなく、本人の資質との結合確率として現れるはずである(導出略)。
つまり、同じようなレベルの知性であってもリベラルな発言をしていると、そのレベルの知性で保守的発言をしているよりも知的に優れていると誤って評価されるということだ。また、その評価に安住する危険性も高いだろう。
すなわち、実を言うと
P(知性がある|リベラル∩世間的評価が高い) < P(知性がある|保守∩世間的評価が高い)
と思われるのである(多分こう書くと、世間的評価が高いから知性が高いって言えるのかなどと噛みつかれるだろうが、あくまで式表現として提示しているのである)。同じくらいの知性があると評価されているなら、保守よりもリベラルの人間の方が真の知性レベルは低いのではないか。
今回鳥越俊太郎の件はこの点をまざまざと明らかにし、やはり意思決定にベイズ的思考を投入しなければならない必要性を強く感じさせた。鳥越俊太郎はリベラルな発言をしてはいたものの、「鳥越俊太郎には知性がある」という事前確率は著しく低かったというべきだ。一般的評価はリベラルの立場のいる人間について甘めに働くため、これまで世間的に評判が良かったとしてもリベラルの立場の人間についてはより厳しく本人の知性を見極めなければならなかった。ということであろう。
岡田さんが敵前逃亡したというが、鳥越俊太郎のあそこまでのバカぶりを見せられた後では同情する面もあろう。上の式展開により、「基本的には知性のある人はリベラルの立場をとりがちだと思われている」ような社会においては、保守である自民党よりも、リベラルである民進党の方が候補者選びに苦労することは、決して岡田さんが悪いというよりもこの社会における必然であることが数学的に確認された。
(なんちゃってね)
そろそろ大学院入試シーズンなので,聞かれそうな質問をまとめてみた.
質問は大きく分けて2種類ある.コンテキストに強く依存した質問と,テンプレ質問だ.
このうち,後者は仮に試験官が一切話を聞いていなかったとしてもできる質問だ.時間を掛ければ対策はできる.
よっぽど試験官の頭が良くない限りはテンプレ質問ばかり来るから,
テンプレ質問の準備をしておけば院試は恐れることはない.試験範囲が決まった筆記試験のようなものだ.
また,コンテキスト依存の質問も発表内容のみからできる質問と,そうではない質問に分けることができる.
『「手法にはナイーブベイズ法,決定木,SVMがあり,そのうちSVMを採用する」
とおっしゃっていましたが,なぜ他の手法を採用しなかったのですか?』
穴のない発表をすることは難しいので(試験官がちゃんと話を聞いていれば)
この手の類いの質問はよく来る.
論理的に行われる質問は,論理を押さえておけば容易に対策できる.
つまり,
あたりを押さえておけばいい.
例に挙げた質問に対しては,他の手法を採用しない理由,SVMを採用する積極的な理由を
きちんと答えられればOKだ.
これは試験官がその領域に対する知識を持っていて,かつ突っ込みどころがあるときに来る質問だ.
質問の種類としては一番対策が困難だが,これを綺麗に返すことができれば評価はうなぎ登り.
例えば,『「機械学習にSVMを利用する」とおっしゃいましたが,
ニューラルネットワークなど別の手法はご検討されなかったのでしょうか』
といった質問だ.もちろん検討しているけれど時間の都合上紹介しなかったという
雰囲気を出しつつ,隠しスライドでも出しながら説明すれば良い.
この質問に関しては,ひたすら基礎勉強・サーベイをして知識を身に付けるしかない.
時間がないのであれば不勉強を悔いつつ,このような質問が来ないように誘導しよう.
こういう質問だらけになることはまずないが,現実はそうではない.
逆に言えば,誰もが思いつくようなこのような質問に
うまく答えられない場合は評価はかなり低くなってしまうだろう.
いつでも明確な回答ができるように準備しよう.
上記新規性・有用性の変形だが,こちらの方がやや難しいことがある.
志望研究科が学際的な場合,特に前者の質問にはかなり困るけれど,
何となくそれっぽいことを答えよう.
時間が短い場合,これらを全て押さえた十分な発表を行うことは難しい.
ただし,これらについてはいつ聞かれてもいいように,
発表には使わなくてもスライドは用意しよう.
修士の院試であればどうせ研究は終わっていないのだから,絵空事を答えればいい.
このような質問をする人は大抵何もわかっていないので,何を答えても納得してくれる.
読んで無くてもタイトルを5本くらいは挙げて,
それらしい説明をしよう.
院試なんてものは通過儀礼なので適当に流せばいいと思うけれど,
これらの質問は学会その他にも応用できるので日頃から考えておくと良い.
また加減が難しいところではあるけれど,例えば先行研究を一切説明しないなどのように
あえて穴を作っておいて質問をそこに誘導するという手法もある.
明かな穴がある発表をしたことのマイナス評価を上回る場合は有効だ.
学位審査や院試といった場においては狙ってもいいかもしれないが,
そのslideshareの人はただのgiftedなのでもう少し他のを参考にした方がいいと思う。
機械学習に興味を持ってビショップ本に行くのもあまりお勧めできない。
過剰にベイジアンだし実際問題あそこまで徹底的にベイズにする必要は無いことも多いから。
よく知らんけどMRIとかの方面もだいぶ魑魅魍魎なので(DTIとか微分幾何学的な話がモリモリ出てくる)、
近づくなら覚悟と見通しを持ってやった方がいいんじゃないかなあという気はする。
オライリーの本は読んだことないけど悪くなさそう。「わかパタ」とか「続パタ」とかは定番でよい。
ビッグデータがどうとか世間では言ってるけど、データのビッグさはあんま気にしなくていいと思う。
ビッグデータを処理するためのインフラ技術というものはあるけど、数理的な手法としては別に大して変わらない。
(オンライン学習とか分散学習とかの手法はあるけど、わざわざそっち方面に行く意味も無いと思う。
超大規模遺伝子データベースからパターン検出したい、とかだとその辺が必要かもしれないけど…)
数学については、線形代数は本当に全ての基礎なのでやはり分かっておくとよい。
「キーポイント線形代数」とか「なっとくする行列・ベクトル」とか、他にも色々わかりやすいいい本がある。
(まあ固有値と固有ベクトルが計算できて計量線形空間のイメージがわかって行列式とかトレースとかにまつわる計算が手に馴染むくらい。ジョルダン標準形とかは別にいらん)
プログラミングはそのくらいやってるならそれでいいんじゃないか、という気はする。行列演算が入る適当なアルゴリズム(カルマンフィルタとか)が書けるくらいか。かく言う俺もあまり人の事は言えないけど。
処理をなるべく簡潔かつ構造的に関数に分割したり、抽象化して(同じ処理をする)異なるアルゴリズムに対するインターフェースを共通化したりとかのプログラミング技術的なところも意識できるとなおよい。
ggplot2は独自の世界観ですげえ構造化してあるんだけどやりすぎてて逆に使いづらい…と俺は思う…。
遺伝子のネットワークとかなんかそれ系の話をし出すと離散数学的なアルゴリズムが必要になってきて一気に辛くなるが、必要性を感じるまでは無視かなあ。
プログラミングの学習は向き不向きが本当に強烈で、個々人の脳の傾向によってどうしたらいいかが結構異なる気がしてる。
向いてるなら割とホイホイ書けるようになっちゃうし、向いてないなら(俺もだけど)試行錯誤が必要になる。
まあせいぜい頑張りましょう。
大学四回生の夏、下宿の扉に「出入禁止」とチョークで大書し、親を呼ばれて精神病院に連れて行かれた。
パソコンを買ってもらったのは小学三年生の冬だった。今でも覚えている。1996年12月2日のことだ。Windows95発売で世間は揺れていた。インターネット回線がうちに来たのは翌97年の1月、これはそこそこ早い導入だったと思う。さらに翌々年の99年にはケーブルテレビで常時接続になった。親には先見の明があったが、しかしパソコンには詳しくなかった。PC-8001も確かそうだ。親はこれが次世代の必需品になると確信して買っていたが、買った一方で使い道が分からなくてオブジェとして放置していた。親はPC-8001をパソコンだと言っていたけれど、僕にとってパソコンはおっきなテレビが標準で付属しているものだったし、マウスもなかったので、それがパソコンだとは到底思えなかった。でも親は言った。今度来るのは違うんだ、オフィスも入っているパソコンなんだ。僕は聞いた。一太郎っていうやつは入ってないの?テレビで言ってたよ、と。親は答えた。オフィスってのは一太郎より機能がスゴイんだよ。僕はへぇ、とだけ言った。どちらにせよペイントは入っているだろう。ペイントなら親戚の家で使わせてもらったことがある。パソコンはお絵かきができるのだ。マウスをカチカチして、キーボードをカチャカチャするのだけが楽しみで、納品の日を一週間ひたすら待った。その頃、漢字の宿題提出が滞っていて、そのままでは居残りでさせられることになっていた。僕は久々に奮起した。いつもは踏み倒していた宿題を、全部一気に終わらせた。家に帰るとパソコンが電気屋さんの手で設置されつつあった。今は亡き、ニノミヤで買われたパソコンであった。
97年にインターネットを始めた。一日一時間まで。実のところ電話代の問題ではなく、一時間ほど使うとブルースクリーンが発生するからだった。一日一時間以上動かすと壊れるから。PC-8001をキッチリ買った親なのに、それぐらいの(?)ITリテラシーであった。ただ別にそれを責めるつもりはない。僕はすぐにアングラサイトに入り浸った。人に飢えていたのだ。普通のチャットには人がいない。テレホタイムにならないと、誰一人ログイン氏亡いのだ。でも、アングラサイトなら四六時中書き込みがある。僕は思う存分厨房行為を楽しんだ。煽り騙りなんかは、小学生がやっても大人がやっても大して変わらないものだ。You is a big fool manという文句をリアルタイムで目にした人は、多くても数百人だっただろう。何千、何万のツイッタラーが押し寄せ、ブクマが1000以上付くような今の炎上とはほど遠い暢気さだ。当時の匿名掲示板とはそういうものだった。誰一人本気で投稿しなかったし、しかし誰一人面白くない書き込みをしようとはしなかった。トイレでもネタを考え、思いつけばすぐに投稿し、ワラタが付くのを待ち続ける。あやしい、あめぞう、あやしい、2ch。人の多いところから人の多いところへ。ワラタが多くもらえる場所へ。気づいたらインパクが終わっていた。
その一方で僕は中高一貫の私立校に入学していた。高校受験がないことから、ネット依存はさらに加速した。しかし2000年を境にアングラ掲示板は衰退の一途をたどり、2ch一強時代を迎えていた。1ch.tvをボコったりするなど楽しいネタがないわけではなかったが、匿名掲示板はネタの宝庫と言うより、本気でちゃんと議論することもできる場所になり始めていた。ちゃんと議論しようとしたらすぐさま崩しにかかるのが2ch隆盛以前の匿名掲示板文化であったが、2003年頃を境にはっきりと潮目が変わっていったように思う。まあその辺はどうでもいい。アングラと非アングラの境目は消え始めていた。
その狭間に、僕は生きていた。
自分で掲示板を設置することにした。けれども何をして良いのか分からない。CGIレスキューに救援要請をして本も買った。Perlだ。Perlしかない。しかしPerlがどうして動いているのかは、全く分からなかった。何十行、何百行もの文字の羅列が、どこでどうなって、掲示板になるのか。インタプリタ?コンパイラ?訳が分からない。そもそもCPUがどうやって動いているのかも分からない。僕にとってプログラムとは、セットアップウィザードでCD-ROMをギュンギュン言わせながらインストールするものであって、掲示板というものは、Teacupで借りるものだったからだ。でもどうやらそうじゃないらしい。コンピューターに翻訳するのがコンパイラです。さっそくコンパイラを使ってみましょう……
お手上げだった。
コンパイラがないのだ。コマンドプロンプトにはない。Linuxを入れる?使い方が分からない。Vine Linuxが初心者にお勧めだった頃の話だ。ボケッとしててもGNomeぐらいは動かせる程度には簡単になっていたが、そこからターミナルを開いてgccでコンパイルするなんて想像も付かないことだった。Hello, Worldはなんとか表示できても、それをGUIで動かす方法が分からない。僕はデスクトップに「Hello, World」のポップアップウインドウを表示させたかったのに。全然訳が分からなかった。
プログラムが動いている方法を知らなければならない。プログラミングを学ばなければいけない。しかし全体像を把握するにはあまりにもほど遠い……。絶望感が支配し始めていた。Hello, Worldはできたけれど、その先が全くわからない。どの参考書を読んでも分からない。ググってもググっても分からない。ポインタで躓く初心者が多いです!……どの本にも書いてあったけれど、僕はポインタどころか、変数の種類がたくさんあるところでお手上げだった。int?char?long???意味不明の文字列が並び続ける。メモリ?メモリって、挿したらいいんじゃないの?確保?fopen????どんなプログラミング言語も、何一つ分からなかった。その頃インターネットは加速し始めていた。切るのが当たり前だったJavascriptが復権し、Ajaxと名を変えてやってきた。掲示板スクリプトもどんどん高機能化し、もはやPerlを知るだけでは何一つできないようになってしまった。苦痛の日々が始まった。どの言語も、全く分からなかった。分からなければならないという焦りが募っていった。
あるとき、一年間ほど、とりあえずお手上げのままにしておくことにした。大学受験が迫ってきたからだった。そして案外あっけなくそれは終わった。僕は某大学の情報科学科に入った。
教授がガイダンスで説明したとおり、情報科学科のプログラミング演習はそれほど多いものではなかった。一回生の時なんか、キーボードを目で追って人差し指で打っている人もいるぐらいだった。学校の授業はアテにならない。そして大学受験でいったん引っ込んだ、とにかく十代でなにかしないと、という焦りが復活してきた。
大学のキャンパスは広すぎた。何をして良いのか全く分からなかった。授業内容はひどくつまらなく、何が役に立つのかも分からず、ただただ苦痛で、キャンパスでサークル活動に打ち込んで楽しく過ごせるほど社交的ではなく、かといってオタク集団に混じる勇気も無く、とにかく、とにかくここで四年間、四年間で何かしないと、何かしないと就職に間に合わない、大学院進学に間に合わない、十代のうちに何か大きな事を成し遂げなければならない。日々研鑽に励み、日々プログラミングスキルを磨き、日々勉強会に参加し、日々コードを書き、日々環境設定をし、日々本を読み、そして日々コードを美しく書かなければならない、そういう焦りだけがどんどん加速していった。大学の生協で片っ端からプログラミングの本を買った。ド初心者向けのPerl本から、美しいコードは何か、みたいな本まで。でも、どれ一つ、僕のスキル向上には役に立たなかった。プログラミングスキルの向上=自分自身の地位=生活の保障、と思っていた自分には、悪夢のような現実だった。
とにかくインターネットと一緒に歩んできた僕にとって、ITスキルはすなわち力であり、むしろITスキル以外は何の価値も持たないもの、と思えるほど脅迫的な観念にとらわれていた。入ってくる情報はさらに増えていった。Cができるのは当たり前、Ruby on Railsがアツい、Java、PHPはもちろんできるよね、MySQLは当然使えるよね、もちろんHaskell、Scheme、Objective-Cもやらなきゃね……何一つできないのに、習得すべき言語だけがどんどん増えていく。加えて美しいコードを書け!という文句が飛んでくる。クソッタレが。何が美しいコードじゃ。goto使ってもいいだろ。好きなだけ使わせろクソッタレが。全部getsで書いてやる。クソが。アルゴリズムアルゴリズム勉強会勉強会ビューティフルコードMacMacMacジョブズジョブズジョブズ……???????????????
それでもなんとか、そう、なんとかなった。友達が優秀だったのだ。僕には到底できないような、きれいに整理されたコードを書く人だった。聞けば在学中から外注のプログラマをやっていて、それなりに稼いでいたのだという。性格はちょっとアレで、風俗に勇気を出して行こうかどうしようか迷ったけどその金でオナホ買ってシコってオナホを床に叩きつけたみたいなヤツだったけれど、そいつからもらったコードを、わざと汚く成形し、変数名も汚らしくし、提出し、なんとかなった。結局自分で最初から最後までプログラムを作ることはできなかった。丸々コピペはしなかったけれど、コピペがなければ卒業は無理だっただろう。
そうして三回生の終わり、試験がどっと押し寄せてきた。一月のことだった。機械学習と……なんだっけ?そういう感じの試験が、2月の初日、行われることになった。三回生はただでさえ試験が多かったが、その大トリこそが機械学習だったのだ。
まるで意味が分からなかった。推論、それは分かる、機械学習?機械に学習??やっていることは数式だしベイズがどうの……まるで分からない。泣きそうだった。三年間必死こいて勉強したり勉強会に行ったりプログラミングスキルを上げようとしたり本を読んだり色々したのに、何一つ得るものは無かったのだ。僕はあやしいわーるどでオマンコ連呼していた頃から、何一つ成長出来なかったのだ。そしてそれは、間違いなく、疑いようがなく、自分のせいだった。自分の頭が悪いせいで。自分の勉強不足のせいで。自分のせいで……コンピュータとともに、十何年も育っていた僕にとって、コンピュータに関するスキルこそが、全ての力の基準だったのに、その全てを否定されたような気持ちだった。プログラミングができなければ、死ぬ。だって、友達はみんな就職して、SEになったりSIerで働いたりネットワーク管理者になったりしてるのに、僕はなんで、こんなところに。そいつらに取り残されるのに。みんな勉強会に出てMacを持ち寄ってハッカソンしてるのに。泊まり込みでプログラミングしたりしてるのに。なんで僕は、fgetsすらマトモに使えず、getsとscanfだけであなたの名前を入力してください オマンコ オマンコさん、こんにちは!みたいなプログラムしか書けないんだ。
大学四回生になった。研究室を選択する必要があったがしなかった。しないでは困るとのことで、適当に書いたらその一番上に配属された。でも一切研究せず、下宿に引きこもって何もしないをした。今日の輪講はここまで進みました!という報告が毎週回ってくるが、まるで研究室では日本語でなくアラビア語が公用語になっているのではないかと思えるぐらいの光景だった。この頃、近所の人の証言によれば、言動がおかしく、訪ねてきた人に暴言で返し、殺す殺すなどの声が聞こえ、時折モノを投げつける音が聞こえたりしたそうだ。まあよく知らない。僕は普通に何もせずぼんやりネットを見ていただけのような気がするけど。
それからしばらく経った。
結局僕は中退した。そして別の大学に入り直した。今度は、工学じゃない別の場所に。みんなキーボードの文字を読みながら指先でキーを叩いている。安心する光景だった。僕らはプログラミングを習わなくてもいい。これから習う必要も無い。タッチタイピングだって、できるに超したことはないだろうけど、できなくてもいい。ただ、そこにある便利なモノを使えば良いだけなのだ。Chromeを使っていて、うっかり開発者向けコンソールを開いてしまっても、何も分からなかったことにして閉じて良いのだ。きっとマクロを書けば、楽ちんに勝手にやってくれるような作業を、人の手で何度もやる。それでいいんだ。マクロを考えるために必死になる必要なんか無い。マウスで右クリック、コピー、ペースト。それでいいのだ。キーバインドすら覚えなくて良い。メモ帳を使ってもいい。viやEmacsのキーバインドを覚えなくてもいい。マウスも使えないようなエディタと格闘する必要は無い。Macを買っても、XCodeやportsを入れる必要は無い。iTunesでiPhoneを同期させて、音楽を聴くだけでいいんだ。
僕はもうプログラミングしないでいいんだ。
それが分かったとき、全てから解放されたような気がした。僕を苦しめ続けたプログラミングというものは消えてなくなった。パソコンでやる作業は、昔と一緒、匿名掲示板にオマンコと書き込むだけだ。それ以上のことをしなくてもいいんだ。勉強会に出てハッカソンする必要は無いんだ。プログラミングスキルを錬磨しないと死ぬなんてのはウソだったんだ。美しいコードを書かないと天罰が下るというのはウソだったんだ。毎日毎日はてブのホッテントリを見てると、プログラミングでマスターしなければならないこと、何何する方法、開発者必須スキル、便利ツール、Macでのアプリ開発、セキュリティ、通信、データベース、勉強会、ハッカソン、そういうもので溢れている。苦しくないのか不思議で仕方ない。もちろんプログラミングをしていて楽しい人もいるんだろう。けれど、僕みたいに、プログラミングという行為が苦痛で苦痛で苦痛でしかない人もいる。たとえ1000回の同じ操作でも、人力でやる方がマクロを書くよりも楽だという人も、ここに存在するのだ。そしてそのような人の存在も当たり前に肯定されるのだ。みんな苦しまなくて良いんだ。誰かが勝手にやってくれればいい。できる人にお金を渡して、僕らはそれを享受するだけで良いのだ。ここでプログラミングという言葉を連呼したけれど、コーディングという言葉との違いとか、そういうのを気にするような人とおつきあいする必要は無いのだ。いずれプログラミングは必須スキルになるとか言われて何年も何年も苦しみ続けてきた。けれど、そんなことをする必要は無いんだ。
それでぶっちゃけここからが本番なんだが、十代でなんとかしないと、という焦りはこないだの青木君の小四なりすましの話に似ている。僕もそうだった。僕らの世代だと登大遊氏なんかが結構輝いてて、ああいう感じにならなきゃ、と思っていた節はある。十代の時になにか成し遂げないといけない、そのためには誰かに認めてもらわなければならないという焦りは、どれくらいの「大人」に理解してもらえることなのだろうか?誰かの承認を得たいという承認欲求を、同じ世代の誰かを使って満たすことができず、むしろ同じ世代の誰かを一緒に引き連れて、承認欲求を満たしてくれる「教祖」にすがりつく。NPOの大学生が「承認」を欲し、政治家が「承認」を与えているのだ。AO入試用の作文?図?みたいなものも見かけたが、「私はリーダーシップがあります!」とか実にくだらないことしか書いていない。しかしそういうものでさえ、学生団体とやらは「承認」してくれる。結局、オウム真理教が丸ごと開けたポジションに、バラックが建ち並び闇市が行われていて、コミュニケーションで自然と得られるはずの承認欲求が、法外な札束で取引されている、そんな感じのような気がする。
意外にブクマが増えていた。PC-8001は俺が産まれる前に買われたもので、ずっとオブジェだったのだ。動くかどうかもわからない。テレビに接続するコードがなかったから。
いやいや、「ナイーブベイズ」なんて言葉は単に統計学のマニアックな領域、
の方向では出てこない言葉なわけですよ。
統計学初心者にそこまで詳しくなくて良いよ、という言葉としては選ぶわけが無いわけですよ。
なのにあなたはわざわざそのことばをだした。
いや、だからですね、むしろナイーブベイズなんてのはその手のところでは当たり前なものなわけですよ。
だが一方、統計学、を学ぶ上ではまったくもって必須でもなければ出てこないものなわけですよ。
統計の深い話を知らなくても良いよ、というのなら
だから、俺は「ナイーブベイズを知っとけとは言わないけど」って書いただろ。
その後に「母数や統計量くらいは知っとけ」と書いただろ。
意識高い嫌いで目が曇りすぎなんだよ。
いいか、君の言う普通の統計学の教科書というのはネイマン・ピアソン流の非ベイズ統計学を指す。
それは別にネイマン・ピアソン流がより初等的でベイズがより高級とかいうことを意味するわけじゃない。文化体系が違うだけ。
現実問題で統計がどうとか言うときに絶対出てくる「変数が死ぬほど多い」とか「データが全然少ない」とかいう問題をどう捉えるんだ?ベイズモデルがいるだろ。
統計学の教科書とかで"ナイーブベイズ"ってフレーズが出てくる方が稀だと思うけど?
単純な分類の仕方を実装できる、ってんでソフトを構築する上でよく出てくるものだよね?
それでその辺のプログラミングの話の中で統計処理の話をしてるとよく出てくる言葉だと思うんだけど。
ナイーブベイズはその名の通り相関関係を無視した最も単純なモデルのことであって、単純なことくらいは知っといてねという意味だよ
統計処理、の話をするときに「ベイズの定理」とかを持ち出すなら分かるよ?
でも「ナイーブベイズ」なんて言葉は最近の機械学習とかで流行ってる言葉でそれで知ったんでしょ?
そんなものわざわざ持ち出す必要無い、というか意味ないことくらいしっかり統計学の勉強してれば分かるでしょ?
分からないの?
http://anond.hatelabo.jp/20140421200127
以下記事の元増田です。
「" 東大生正解率8%の問題wwwwwwww "とやら 」
http://anond.hatelabo.jp/20140120091329
モンティ・ホール問題についてのツイートがあったのでちょっと調べてみた
(1) 3つのドア (A, B, C) に(景品、ヤギ、ヤギ)がランダムに入っている。
(2) プレイヤーはドアを1つ選ぶ。
(3) モンティは残りのドアのうち1つを必ず開ける。
解説によると最初に選んだままなら1/3、
ドアを変更すれば残りの二つのドアを選ぶことになるので2/3で当たるといった感じ。
ただ疑問なのはモンティがはずれを開けた後、その1/3分の確率が
選ばれていないドアに移るという解説。
(1) 2つのドア (A, B) に(景品、ヤギ)がランダムに入っている。
(2) プレイヤーはドアを1つ選ぶ。
(3) モンティは残りのドアの1つを必ず開ける。
あたりまえだが、この例では必ず当たる。
モンティが開けた分の1/2がどこに行くのか?
もしはずれならプレイヤーが選んだドアに1/2が移り確率1となる。
もしあたりなら逆にモンティが開けた側に1/2が移り確率1となる。
ここでいいたいのは、モンティが残りを開け、そのドアに対する結果が確定した瞬間、
プレイヤーが選んだドアに対して確率の移動が起こるということ。
大事なので2回言うと、
wikipediaでの説明では、モンティが空けたドアの分の確率は、
まだ選ばれていないドアへと移る事になっている。
なぜ、プレイヤーの選んだドアへは移らないのか?
モンティ選択分はプレイヤーが選んだドアと選んでいないドア両方に半分ずつ移るという方がしっくり気がする。
加えて、以下の解説
解説によると最初に選んだままなら1/3、
ドアを変更すれば残りの二つのドアを選ぶことになるので2/3で当たるといった感じ。
これも疑問を感じる。
まだ空いていないドア1つと2つを選ぶなら1/3と2/3だろうと思う。
すでに1つははずれが確定しているドアを含む2ドアを選ぶのは2/3だろうか?
未開ドア2つを選ぶのと、1つは確定している2ドアを選ぶのは同じ確率だろうか?
ドア1つと、はずれ確定ドアを含む2ドアのグループを選ぶとき、その確率は1:1じゃないだろうか?
やはり、モンティ選択ドアの確率は均等に移る気がしてならない。
詳しい方よろしくお願いしますm(_ _)m