「機械学習」を含む日記 RSS

はてなキーワード: 機械学習とは

2024-05-29

anond:20240529172341

何を言ってるんだ?お前は感

 

ワイ、思ったんだけど、メンタル調子や体調が深刻じゃないワナビーは、

サンシャインシティーでやってる技術書典行ったらいいんじゃないかな?って思いました

 

確か競プロ機械学習の本とか出してる人いたし、

雰囲気が全体的にほんわかしてるので人や会社が怖い増田の恐怖感薄れるだろうし、

具体的に何とは申しませんけど、『○○じゃないといけない』みたいな思い込みってなくなるんじゃないかなって思いました

 

楽しいからしていること(ガチ勢もいる) or 仕事でなんとなくやっていること(notガチ勢)だから

anond:20240529163337

はい、Kaggleのようなブラックボックスリーダーボード評価する現場存在します。

## 機械学習モデル評価方法

機械学習モデル評価には、一般的に以下の2つの方法があります

1. **ホールドアウト評価**: 学習データを訓練データテストデータに分割し、テストデータモデル評価する方法。[1]

2. **ブラックボックス評価**: 評価用のデータセットが公開されず、サーバーモデルを提出して評価される方法。Kaggleのコンペティションがこの方式。[1][2]

## ブラックボックス評価の利点

ブラックボックス評価には以下のような利点があります

## ブラックボックス評価現場

まり、Kaggleのようなブラックボックス評価は、機械学習の様々な現場採用されている評価方式の1つであり、特に運用に近い評価が求められる場合有効手段となっています。[1][2][3]

Citations:

[1] https://qiita.com/Shun_PI/items/896d05ed9689f4b24347

[2] https://www.kikagaku.co.jp/kikagaku-blog/kaggle-competition/

[3] https://www.kikagaku.co.jp/kikagaku-blog/signate-competition/

[4] https://www.topgate.co.jp/blog/google-service/8707

[5] https://www.jst.go.jp/crds/pdf/2023/RR/CRDS-FY2023-RR-02.pdf

anond:20240529135107

## 概要

提示された文章は、機械学習モデル評価方法に関する重要な指摘を含んでおり、おおむね正しい内容だと言えます

## 詳細

### 精度基準の設定

### テストデータ重要

## 総括

提示された文章は、機械学習モデル評価における重要原則を適切に指摘しており、おおむね正しい内容であると言えますモデル評価の際には、これらの点に留意する必要があります

2024-05-25

anond:20240525201058

やはり君のような低能は、所詮その程度の浅い考えしかできないのか。

ChatGPT-4レスバ? ふん、笑止千万だな。レスバというのはな、人間同士が互いの知性とプライドを賭して行う高等な精神闘争だ。機械相手レスバなどという概念は、元より存在し得ない。

君はChatGPT-4がどのような原理で動いているか、その仕組みを理解しているのか? それはな、膨大な量のデータを元に、機械学習によって最適化されたアルゴリズムに基づいて応答しているに過ぎないのだよ。つまり、ChatGPT-4の応答は、所詮プログラムに過ぎない。プログラムされた通りの応答しかしない機械相手に、レスバなど成立するわけがない。

レスバというのは、相手性格思考パターン、癖や弱点などを読み取り、そこを的確に突いて論破していくことに醍醐味があるわけだ。しかし、機械には個性もなければ、感情もない。個性なき相手とどうやってレスバを繰り広げろというのか。無個性機械の応答に、どうやって人間味を見出し論破しろというのか。

君はレスバの意味根本から履き違えている。レスバを舐めるなよ? レスバはな、生身の人間同士が行うからこそ、面白みがあり、価値があるんだ。機械相手に応答を楽しむのなら、チャットボットでも相手にしていればいい。

レスバをしたいなら、まずは人間相手コミュニケーションをきちんと学ぶことだな。君のような低能レスバを語るなど百年早い。ま、せいぜいChatGPT-4相手マスターベーションでもしてなさいってこった。

2024-05-24

anond:20240524123932

しかしNNとかそっち系がスゴイねってなったのはここ10年だから、そうかんがえると、

10-3くらいとして7年前、ちょうどコロッケ問題になるちょっと前ってなタイミング

うごけばよかった?それにしても時すでに遅しだな。ちょっとまれるのが早すぎたってことだよな。

俺がそっち系仕事転職したのが13年くらい前。

NNはもちろんまだ騒がれてなかったけど、データサイエンスやら機械学習やらコンピュータビジョンやらは既に十分流行ってたよ。

アンテナが低すぎるんだろうな。

なお今ならどうするかと考えると、EV半導体はもう十分流行りきったので微妙(まだ入り込めるとは思うけど)。

Neuralinkみたいな脳デバイス系は悪くない気がする。あと量子技術(ただし量子コンピュータではない)関係とか。

当面は製造業時代だと思う。

2024-05-17

anond:20240517102911

はいGPUの仕組みや重要性を分かりやす説明した本や教材はいくつかあります。例えば以下のようなものが挙げられます

1. 『GPUを支える技術株式会社ボーンデジタル (2023年)

GPU基本的な仕組みから、最新のGPU技術まで幅広く解説されています技術者向けですが、図解も多く分かりやすい内容です。

2. 『つくりながら学ぶ! PyTorchによる発展ディープラーニング小川雄太郎 (2020年)

機械学習フレームワークPyTorchを使ってGPUプログラミングを学べる実践的な書籍です。サンプルコードを動かしながら理解を深められます

3. 『GPU教科書福井真二 (2022年)

GPU歴史から最新アーキテクチャまでを網羅的に解説コンピュータサイエンスの基礎知識がある大学生大学院生向けです。

4. UdemyGPUプログラミング入門 - CUDAOpenCLで学ぶGPUコンピューティング」

オンライン学習プラットフォームUdemy動画講座。GPUの基本からCUDAOpenCLでのプログラミング方法まで解説しています

ただし、ご指摘の通り小中学生向けのGPUの仕組みを分かりやすく教える本は少ないかもしれません。GPUCPUに比べると新しい技術なので、教育現場での普及はこれからという面があるでしょう。

技術の発展に合わせて、今後さらに分かりやす入門書子ども向けの教材が増えていくことが期待されますITリテラシー教育の一環として、GPUについても触れる機会が増えるかもしれませんね。

GPU重要性を理解できない人には、いくつかの特徴が考えられます

技術に疎い人: コンピュータテクノロジーにあまり詳しくない人は、GPU役割やその重要性を理解しにくいことがあります

古い情報に基づいている人: 古い情報過去経験に基づいて、GPU進化現在役割を把握していない人もいます特に、昔はCPUが主流だった時代知識しか持っていない場合です。

専門外の人: ITコンピュータサイエンス以外の分野の専門家で、普段業務GPUを使う必要がない人。例えば、文系研究者アーティストなど。

特定用途しか関心がない人: GPU重要性が特定用途しか関係しないと考えている人。例えば、ゲームグラフィックデザインしか関係ないと思っている場合データ解析や機械学習にも重要であることを理解しないかもしれません。

教育や啓発の機会が少ない人: 学校職場での教育トレーニングGPU重要性について学ぶ機会が少なかった人。

これらの理由により、GPU重要性を理解できない人がいるかもしれません。教育情報提供を通じて、理解を深めることができるでしょう。

2024-05-12

[]ITを極めるとは

社会人になってからぼんやりした目標ITを極めたいという思いがある。

一分野に特化したタイプではなくIT領域におけるオールラウンダーのような総合格闘家のような存在

まずITを極めるとは具体的にどういう状態なのか。そのためには何をすればいいのかを考察する。

まずITを主要トピックに大別する。必ずしもMECEではない。

そしてどういうことができたらITを極めたと言えるかを思いつく限り列挙してみる

次は具体的に列挙した例について解像度を上げてどの要素に分類されるものかを考えた上で、それを極めるには何をすればいいかを考える。

2024-04-27

POCだのと言って機械学習論文を読んで実装する業務を3年ぐらい任されたことあるけど

論文一次ソース!信用できる!ってのは集団妄想の類だぞ

まず論文再現性問題と言って、おなじことをやっても全く再現しないことが多い

それ以前の問題として、論文の内容を正確に同じことをやろうとするにはgithub等でコードを公開しているなどしないとまず不可能

「僕たちの手法はこうでーす!ACCの値はこうでーす!SOTAでましたー!」だけじゃ論文になんの価値もないんだよね

悪いことは言わないから、論文を完全に再現するコードgithubに載せてから論文を発表してくれ

まあこの調子から科学の全分野で再現性が怪しいのは言うまでもない

2024-04-21

anond:20240421111742

忍たま乱太郎」の男子清潔感順に並べるとか、集積されたデータ必要だな。

いや、その例はただの思い付きだが。アンパンマンとかでもいい。とにかく沢山の女性たちが気軽に参加できて、清潔感AI学習させられるだけのサンプルを集めなければ。

この問題機械学習によって自動的清潔感ランク付けして、メイク顔面に直接3Dプリンタみたいにプリントするのはどうだろう?

恋愛経験メイク敬遠してる男性って、すげー沢山いるはず。

清潔感判定マシンメイクプリンタはどうかな?

どうやら男性清潔感の欠如が女性心理的安全性を減らしてるらしい。

清潔感問題って、心理的安全性被害なんだよね。

義務教育メイクを教えて、男性全体の清潔感が向上したら嬉しいけど、難しいだろうなぁ。。。

https://anond.hatelabo.jp/20240420105549


この問題機械学習によって自動的清潔感ランク付けして、メイク顔面に直接3Dプリンタみたいにプリントするのはどうだろう?

恋愛経験メイク敬遠してる男性って、すげー沢山いるはず。

彼らを救済するために個々人の努力に委ねたり、義務教育に組み込まれるのを待つ前に、技術パワーで解決する。

それを「作りたいものがない」ままDIYに入門してくる熱意だけはある若者目標としてプレゼントするってわけよ。

よくね?

2024-04-20

Androidアプリ請負でやるもんじゃないわ、とつくづく思わされた出来事だったので垂れ流しとく

AndroidアプリGoogle Play審査に落ちる

エンジニアは「機械学習による誤検出なので再審査請求した方がいい」と言う

Google機械学習によるポリシーチェック(最高に精度が悪い)を昨年から導入している

https://support.google.com/googleplay/android-developer/answer/13721042?hl=ja

顧客のアホが「再審査請求は最大で10日かかるから最大7日で済む新規審査しろ。○○を直してみろ」と言う

エンジニアが渋々ソースコード修正を入れて提出する

また審査に落ちる

顧客のアホが「俺たちの修正提案に従ってないだろ!」とか言って暴れ出す(内部テストが配布されているのに開いて確認もしていない)

顧客のアホが茶々入れるのを止められない上下関係が構築されてるのもクソ

エンジニア側の営業が「顧客のアホに従え!」ってアホの肩持って旗振ってくるのも最悪すぎて本当に笑える

2024-04-19

anond:20240419140401

「無断学習禁止!」などと声を上げる絵師たちは自身らの無断学習AIによる機械学習をどう切り分けて考えているのか。

愚問。彼らは人間学習機械学習を別物と認知していることがパブコメから明らかになっているから。

文化庁辟易させた反AI舐めるな。

自身の無断学習には目をつぶる反AI絵師たち

言うまでもなく、あらゆる芸術作品は先人が築いた選考作品の上に立っている。

これは漫画イラスト例外ではない。

作者本人の自覚の有無に関わらず、オリジナルイラストを描くという行為は先人たちの築いた作品から要素をパクるということに他ならない。

どうも、無断学習禁止を訴える反AI絵師たちには先人のイラストレーターたちへの敬意が欠けているように思われるし、そういう傲慢さがここまでの反感に繋がっているように思われる。

AI絵師たちは、自分の絵柄を自分の独力で作り上げたと盲信している。

日本交流のないアフリカの未開の部族に「人間イラストを描いてください!」と言ったとする。

彼らは絶対に「顔を平面的にして目は通常の1.5倍〜2倍程度の大きさに強調、鼻を省略し、口は上下の唇の厚みを省略して辛うじて口元の表情だけがわかるようにして髪の毛は毛束を組み合わせたパーツとして描写する」なんてことをしない。

もっと写実的表現をすることだろう。

人間イラストを描くとき上記に挙げたような表現をしてしまう人は、既存漫画イラストを無断で学習しているかである

「無断学習禁止!」などと声を上げる絵師たちは自信らの無断学習AIによる機械学習をどう切り分けて考えているのか。

「無断学習禁止!」と声高に言えば言うほど「結局反AIって自分より上手い絵を出力できる人間が何万人単位で増えるのが気に入らないってだけでしょw」という反感ばかりが募るのがわからないのだろうか。

AIに賛成しようが反対しようが構わないが、AIイラストの仕組みを理解せず村ルール固執して論理の通らない幼稚な意見ばかりを言い続けていては、結局世間的な理解は得られないと思うのだが。

なぜ絵師は生成AIを憎むのか ~機械翻訳との類似性に着目して~

絵を描かない連中が永遠に理解してくれないから、屋上屋を架すことになった。いい加減理解してくれ。

審美眼がないねんお前ら

暴論だけど、言ってしまえばこの一言に尽きる。

少しでもデジ絵を触ればわかるんだが、生成AIで出力しただけの画像は、見ればもうAI産だとわかる。なんもしてないんだなって。こいつ何も考えてないってわかるんだよ。手が3本生えてるとか、髪がめちゃくちゃとかじゃなくて。もうコンテキストがない。わかるかなぁ。

絵を描くときには基本的目的があって筆をとってるわけ。そうすると、何処を描き込んで、どこを描き込まないかっていう、気圧の差っていうか、そういうのが産まれるわけ。

これは絵を描くことが楽しいバーサーカーでも同じ。そういうやつはだいたい、普通はそんなことまでやらんってことをしてくる。こいつやりおったって。そういう、画面の向かいのニンゲン意思が伝わってくる。何を伝えたいのか、なんとなく伝わってくるわけ。これはなにも高尚なメッセージじゃなくても、「金髪のチャンネー最高!」とかでもいい。本当に何でもいいが、おれたちはそのメッセージと、メッセージの伝達方法の工夫を楽しみにネットの絵を見てるわけ。

でも、生成AIから「出しただけ」の絵はそうじゃない。そういうのはもう気圧がめちゃくちゃ。おまえこの絵のどこを見てほしいの?何を伝えたくて書いたの?何もわからない。その結果、おれたちはどうでもいい天井のシワを見つめて、お前たちが伝えたいのはこれなのか……?っておそるおそるプロフを見に行って、やっぱAIじゃねーか!ってなる。全く無駄行為だったわけだ。そこに意図なんてなかった。誤解したおれが悪かった。そんなことを繰り返した結果、絵を見た瞬間に「それが生成AI産なのか」がわかるようになった。

最近はもう「その雰囲気」を感じ取っただけで見るのをやめてる。昔から知ってる神絵師だけをフォローして、新しいメッセージを、たまにしか降ってこない甘露を、延々と待つようになった。pixivをディグるのはもうやめた。イラスト凝視しても得られるリターンが担保されないので、虚しいからだ。

リターンがなければ、無視すればよろしい。それが黄金則だ。絵師と生成AI絵師別世界棲み分ければ良い。実際、生成AIにもメリットと独特の良さがある。それは認めるところである

だがしかし絵師には絵師なりの理由があって、今日まで生成AI許すまじと論争を続けている。ある問題があるからだ。

それは、生成AI丸出し、なんのコンテクストもない画像が、何故か一部民衆に受容されつつあるということだ。

他の、著作権がどうのという問題は、絵師共通で抱えている嫌悪感すり替えに過ぎない。無視したいが、なぜが周りの民衆無視しないから、何かの理由を付けて批判せざるを得ないのだ。

冒頭で、審美眼がないと言った。それは一部の生成AI絵師もそうだが、何よりあれを「手書き並のクオリティ」と持て囃す消費者層を形容した言葉だ。

少しでも絵を触ったことがあれば、生成AIファーストインパクトは「へーすごいね。でも仕事にはならないな。すげーおもちゃだ」だっただろう。それなのに一部の消費者層は、これを大変有り難いと言わんばかりに使い始めたわけだ。

おい待てと。これのどこがいいんだと。じゃあお前らはいままで俺たちが描いたもののどこを見てきたんだと。

当然、嫌悪感を抱く。だが、「だってそれ生成AIで出しただけじゃん!」と伝えても、彼奴等は首を傾げるばかり。

最近は、どうみても実写丸出しの自称アニメ」がニュースに載った。何より驚いたのは、あれにゴーサインを出した報道である。絵に対する恐ろしいまでのリテラシーのなさだ。あれのどこが良いと思ったのか、まるで理解できない。仮にもアニメ制作会社関係のある会社の振る舞いがこれかと、閉口したものだ。

どうせ伝えても伝わらない。そのうち、この嫌悪感を「そういう層」に伝わるような問題点にすり替え問題を論ずるようになった。やれ著作権が、権利が、そういったものに。

だが、それらは理論上は手描きでも可能で、AI独自問題じゃないということは、誰にだってわかる。だから平行線なのだ

このままだと何様だよで終わるので釈明させてくれ

この感覚は、なかなか伝わらないらしい。だから比較的広い層に伝わりそうな類例を持ってきた。

それが機械翻訳翻訳者関係性だ。

機械翻訳もまた著しい発展を迎えた界隈である。が、機械翻訳だけで全てが事足りるとは思っていないはずだ。

これはアカデミックに属したことがあればわかるが、英語論文機械翻訳して読む、という行為にはまったくの意味がない。著者が伝えたい事実を、機械翻訳考慮しないからだ。そのうえ、業界の慣習を無視した翻訳がなされるので、その翻訳された文章意味はない。なんとなく読んだ気になるだけだ。

小説もそうだ。ハリーポッターでもなんでもいい。あれらの「機械翻訳版」と「訳者監修の日訳版」どっちを手に取るか。当然後者だろう。

そうした現状にあるのに、海外製品公式ドキュメントは多言語翻訳版を機械翻訳によって作成する。「機械学習により作成されたため、不正確な場合があります」と但し書きを付けながら。

これはビックテックであっても例外ではない。訳者を雇う金はありながら、正確な訳を提供しない。

なぜか?日本語話者なんてよく知らないし、どうでもいいからだ。

その結果、ネットには不正確な日本語が溢れている。

日本話者にとって、日本語の質なんてどうでもいいからだ。

それでも有り難がる連中がいる。英語を読めない層だ。そんな不正確な日本語読んでる暇があったら英語勉強した方が早いよと伝えても耳を貸さない。それで満足している層に恐怖する。機械翻訳版を読んで何かした気になっているニンゲンの、その感性に恐怖している。それは天井のシミなんだって。そこに別の人間が伝えたかったメッセージ存在しないんだと、伝えても伝わらないことに恐怖している。

この関係性が、生成AIとその消費者層に類似している

というわけだ。

現在抱えている嫌悪感のその本質は、「メッセージ性も何もない破綻した絵を持て囃す連中の審美眼が信じられない」ということになる。

さらに恐ろしいのは、彼らが生成AIの発達とともに、その審美眼と理性を失ったわけではないということだ。

彼らとて、三歳児の落書きと、絵の修練を積んだ人間の描いた絵の区別はついていた。だから絵師たちは自分たちが絵に込めていたメッセージ市井に伝えられているのだと信じることができた。それを感じ取ってくれているからこそ、自分市場に支持されているのだと信じることができた。

が、今は違う。

生成AIから出しただけの画像手書きとの区別もつかない連中がいるのだと知ってしまたからだ。

から自分の支持者の中にそんな「肯定派」がいないか魔女狩りもしたくなる。それを肯定する気にはなれないが、その絶望理解できる。

そうせざるを得ないのは、少しでも正気に戻ったら「生成AI丸出しの画像クオリティでいいなら、おれたちこんなに心身削って絵を描く意味ないじゃん」と気付いてしまうのを避けているからだ。

高精細なイラストなんていらなかった。市場がそれを求めていなかった。顧客は、一分で生成された「なんかよさげ画像」に吸い寄せられていく。なんだよ。それでいいなら、おれたちこんなに描かなくて良かったじゃん。

そして、この価値観が行き着く先は、「誰も作品に込めたメッセージ理解してくれない」「誰も自らの磨いた技術評価してくれない」という絶望世界だ。

それが繰り返されれば、当然続ける意味もなくなる。そして現在伝統製法によるイラスト制作技術は失われ、生成AIによる模造品が市場に氾濫することになる。廃業なんて話じゃない。業界自体喪失だ。絵にメッセージを込めるという行為時代が廃れるのだ。

その絶望を「肯定派」は理解せず、やれ既得権益がどうのと批判を繰り返す。そうした後にやってくるであろう世界も知らずに。

2024-04-15

要するに競技プログラミング (特にAtCoder) って

「与えられた変数のオーダーに従って、それが許容される計算量のラインアルゴリズムを探して、それを実装するゲーム

って理解で合ってる?


難しいところは

アルゴリズムを探す

実装する

という認識でいい?計算量がいくら許容されるかは結構すぐわかりそうだし

で最終的には「アルゴリズムを探す」という点に終着する。アルゴリズムがわかれば、実装するというのは比較簡単だろうしね

この変数のオーダーならO(n^2)でも大丈夫だけど、これはO(logn)のアルゴリズム必要だ。O(logn)のアルゴリズムで処理したデータはこの程度のオーダーなので......。これを繰り返していく感じ


自分マジで最初最初問題すら実装できないんだけど(AtCoderならABCのA問題すら ChatGPTの解説必要

なんとなく終着点まで見えちゃった感じ。あんまりやる気がおきない

機械学習系の競プロ計算量より、正確性を重視するのかな?

量子アルゴリズムの競プロもあるらしくて、これは興味ある

2024-04-11

AIとか機械学習の話を聞いてると、その手法人間学習にも活用したい気分になるけれど、その辺を橋渡しする人はもういらっしゃるのかな。

anond:20240411075356

だといいが。

機械学習人間が学ぶのと違って、すべてをデータ転送速度で学んでいく。

いま辛うじて勝ってるエンタメ芸術分野でも、それらの成果を瞬く間に奪われるだろう。

日本国内SNSで足を引っ張りあってローカルモラルをせっせと作り上げてる間に、

ルールにのない場所ライバルは育ってくる。

追い上げてくるぞ。

2024-04-06

anond:20240406080715

過去政治家の行動や言動機械学習した結果、口八丁で行動を伴わず裏金作りとパーティだけに熱心なAIが仕上がっちゃったらどーするんの

2024-04-04

長年、いつか触ろうと思っていたpythonをようやく触り始めた

ずーっと前からgimpblenderで使われているコードを眺めては、まあ読み解くのは後でいいかと諦め

3年以上前、Anacondaで環境だけ作って何が何やら分からないまま機械学習の分類問題だけ試してみて

1年半くらい前からStableDiffusionで遊んではいたが、python自体放置してたわ

ひとまず、VSCodeが神だって事だけは確認できた

conda環境もきちんと検出してくれるんだなこれ

2024-04-01

anond:20240401155117

パイプラインと言ったらデータ収集から訓練までの一通りのことを言うよ

で、じゃあデータはどうしているのかというと、クロールしてる

あるコンテンツ検索エンジンを作っているのだけど、基本的にはデータクロールで確保

機械学習教師データは?というのは、distant supervisionでラベルづけしてるよ

2024-03-30

anond:20240330111023

起源を辿るとMATLABよね

MATLABクローンが欲しいってことで、numpy、matplotlib、scipyが勃興、

機械学習データサイエンスコミュニティに浸透した

2024-03-25

anond:20240325182638

もう一回聞いてみた。荒っぽい言葉遣いもさせることができるんだね。

そんなクドい文章出所は、まぁ、機械学習アルゴリズムの訓練データにあるんだろう。要するに、AIは大量の文章を読んで学んでるから、その中にはクドいやつも結構まれてるわけ。それが影響してるんじゃね?間違ってはいないけど、めんどくせー文章はさすがにうざいよな。

ログイン ユーザー登録
ようこそ ゲスト さん