後編
行列はVBAなんかじゃ無理っぽいし、なんかプログラミング言語を覚えようと決める。
とりあえず両方試そうということで、RのためにRとRstudioをインストール。
プログラミングはなんかを製作する目標がないと挫折すると聞いていたので。
深層学習というものが流行ってると聞いて、ちょっと触りを勉強したくなる。
この本は面白かったので、深層学習を目標にプログラミングを覚えよう!
後になって、これはとんでもない間違いだったことに気づく。深層学習と機械学習の違いも判らないまま、RよりPythonを先に触ることに。
教本にしたのはこちら。
「ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装」
途中まではまあなんとか。
微分って便利だな。行列計算できるの便利だなっていうところまでいったが、クラスという概念が理解できず、途中からハテナが浮かんで読み進められず。
うん、もうちょっと易しい本を探そうと思って手に取ったのが
「独学プログラマー Python言語の基本から仕事のやり方まで」
なんとか読了。自信をつける。
実は、いまだにコマンドプロンプトとパワーシェルとbashの違いが分かってない。
つづいてPyQに2か月くらい登録してみる。
なかなかPythonが楽しくなってきたが、クラス意味が今一つ掴めないままいったん中断。
この辺で、自分は統計に興味があってもプログラミングに興味がないんじゃないかということに気づく。
なんだかんだもがきながら、PythonもRもモノにならず、日常のちょっとした計算やグラフを作ったりはExcelを使い続ける日々が続く。
あるいは、Excelで成形して、検定かけやすい形式にしてRで検定するとか。
Rに触れてなかったな、Rは完全に独学。「こんなことやりたいなぁ、ググってみるか、ほうなるほど」って感じ。
そんなさなか、放送大学で「Rで学ぶ確率統計」という講義があるのを知り、さっそく入学して受講。
なかなか面白かったし、PythonばっかりでRあんまり触ってなかったからいい刺激になった。
恥ずかしながら、負の二項分布やガンマ分布ってよう知らんかった。
しかし、講義は楽しかったがなにか書けるようになったかというとそんなことはなく、依然として基本はExcel。
まあ、実際csvじゃなく、手書きのデータとかをExcelに打ち込んだりする程度なんでPythonやRを使うまでもなかったというのもあるんだけど。
「Excelパワーピボット 7つのステップでデータ集計・分析を「自動化」する」
パワークエリを覚えたらピボット形式のExcelファイルとか、セルの結合が多用されたExcelファイルを、成形加工するのが非常に楽になった。
しかも、同じフォーマットで記録されてるデータならフォルダにぶち込んで一気にまとめ上げることも可能!
控えめにいって神!
としばらくパワークエリを礼賛してたのだけど、各ステップはPythonのpandasやRのdplyrでも出来ることに気づく。というか最初から気づけ。
こりゃ、一気に覚えちまおう、統計というより、データの前処理だなと思ってUdemyでRの動画を買ってみた。
AIエンジニアが教えるRとtidyverseによるデータの前処理講座
https://www.udemy.com/course/r-tidyverse-preprocess/
すっかりR信者になる。
それまで教本を呼んでもdplyrの便利さが今一つわからなかったのに、パワークエリで具体的にモノを作ると、dplyrに翻訳したら、すいすい。スピード10倍。
便利さにようやく気付く。
そんで、pandasに翻訳したらどうなんだろ?と思ったらもっと速いw
すごいなPython。
Rへの入信はたった数週間。再びPythonに興味。
さて、ゼロから作るディープラーニングを再開しようと思ったけれども、そもそも、機械学習をすっ飛ばして深層学習って無茶だったと反省し、まずは機械学習に。
機械学習のエッセンス -実装しながら学ぶPython,数学,アルゴリズム- (Machine Learning)
で、この本がすごい。
5章あるんだけど、機械学習のアルゴリズムは5章だけなんだなw
それまでは何に割かれてるんだって?数式の証明とか、便利な計算法、例えばニュートン法とかラグランジュ未定乗数法とかw
こんだけ引っ張っておいて、いよいよ本番の第5章もゴリゴリ数式をスクリプトに落とし込んでいってるのに、「これは学習のためでscikit-learnっての使えばたった1行」っていう無慈悲w
いや、ほんと数学の勉強になったし、こうやってゴリゴリやるとなんのためにクラスというものが存在するのかようやくわかった。
線形代数って便利なんだなと。行列をスカラー値のように何の気なしに扱えるようになると、あの頃苦しんでいた実験計画法、タグチメソッド、今読み直したら別の印象があるんじゃないかなと思うようになったり。
この本を読む途中、「マンガでわかる統計学因子分析編」で学んだことが理解の助けになった。
なんたる僥倖。
線形回帰、リッジ回帰、SVM、PCA、k-means、クラスター分析、一気に手札が増えた。
Pythonで学ぶ実験計画法入門 ベイズ最適化によるデータ解析
実験計画法って、fisherの古典的なやつ、ラテン方格に割り付けて、ってやつかと思ったら、線形代数使えればもうなんでもありなのな。
これ、すごいな。
機械学習と実験計画法がここでつながるとか、控えめにいって最高だな。
まだ読了してないので、また後日。
2013年の秋、その時の自分は30代前半だった。 衝動的に数学を学び直すことにした。 若くないし、数学を学びなおすには遅すぎると思って尻ごみしていたが、そこを一念発起。 というか...
後編 プログラミングを学ぼうと思い立つ 行列はVBAなんかじゃ無理っぽいし、なんかプログラミング言語を覚えようと決める。 なんでも、統計やるならRという言語がいいらしい。 最近じ...
こんなに勉強熱心なのになんでライン工になったのか気になる
ほんまや。しかも理系の大卒やし。
LINEの開発に関われると思って募集しちゃったおっちょこちょいの可能性が微レ存
ライン工はそんなに悪い仕事ではなかろう
年齢的に、そういう世代だったんだろ。
ゼロ作③苦しみながら読んだら「クラスってすげー!」ってなるからおすすめよ
次は Pytorch にチャレンジしてみたらどうか。 クラスの概念がわかったということなので、ニューラルネットワークが簡単に組めることで更に感動しそう。 (Tensorflow-Keras でもいいけど。V...
この辺で、自分は統計に興味があってもプログラミングに興味がないんじゃないかということに気づく。 世の中ではデータサイエンティスト云々とかキラキラしたこと(?)言ってる...
いやむしろそのほうがいい
そりゃプログラミング好きなやつはその方がいいだろうよ。こちとらコンピューターとか興味ねーんだわ。
データサイエンティストってデータを使って意思決定するという需要に対して存在すると思ってるんだけど、「すべての意思決定をデータで行う」というのはどう考えても不可能で、デ...
なにか難しいことを書いているのにあまり知性を感じないのはなんでだろう・・・ ただそれっぽい名詞を並べてるだけだから?
学んだことが元増田の頭の中で体系化されている様子が見えないからだろうな。「手法」の羅列になっていて理論の全体観を持たない丸暗記のように見えるのだろう。 でもたぶん元増田...
そういう工学系を目指すのであれば既存サービスやフレームワークの使い方を学ぶべきで、 基礎の理論から学ぼうとする本のチョイスがどう考えても工学系ではない理系のそれ。
web系が世界の全てというわけじゃねーから。。。
基礎の理論から学ぼうとする本のチョイスがどう考えても工学系ではない理系のそれ。 ..... いや、工学部でも電子電気系や機械系や化学系や土木系や建築系や数理制御工学系あ...
機械学習は頭の良い奴に任せとけ 凡人は便利ツールを使うだけでいい
大村平さんの本はとてもわかりやすくていいよね。俺もお世話になったわ。
Amazon の個別商品へのリンクはこれだけでいけますよ。全部コピペしなくてもOK https://www.amazon.co.jp/dp/481719457X/
勉強に使う練習用のデータってどうしてる? できれば得られる知見も役に立つものが良いので現実のデータをいじりたいんだけど、 個票データはだいたい「手続きして研究目的等を伝え...
で、それを何に使うの
リンク 2021年度 匿名ダイアリーTOP250 2021年度 匿名ダイアリーTOP251-500 ランキング 順位 ブクマ タイトル 1 2558 当たり屋対策の集合知 2 2336 洪水被害にあったらやる...
リンク 【2021年度】 匿名ダイアリーTOP200 匿名ダイアリーTOP201-300 ランキング 順位 ブクマ タイトル 201 666 美味い素麺なんか食うんじゃなかった 202 665 お前は危険物...
ブクマのゴミどもが食らいついたランキングになんの意味があるのか
ブクマに書くのも無粋だからここに書こ 30位以上で二本入ったわーい 去年までも入ったけど3桁ブクマで下の方がギリギリだったんで
増田って〆12月なんだ
あとで読む(かも
俺の記事があった
ダンス甲子園増田だろ?
オイルぬってメロリンQ♪