機械学習エンジニアとして働いている者として、何点か賛同できない点があったので個人的な主張を述べておきます。
深層学習モデルの作成経験はありますが、いわゆる「GenAI」の動向を詳しく追っているわけではなく、GenAIエンジニアでもありません。
ですので、私の解釈が間違っている場合にはコメントをもらえますと幸いです。
-----------------
(引用) そもそも深層学習の構造を考えると、億単位の画像を学習している基盤モデルに自分の作品が数十枚食われた程度で、個人の絵柄が再現できるはずもない。(引用終わり)
イチから学習させる場合には確かにそうですが、悪意ある一般ユーザーの多くが行うのはLoRAであり、これは汎用的な生成AIに数十枚の特定スタイルの画像を追加学習させることでファインチューニングを行うものだという認識です。
これには数十枚の画像があれば十分なので、「個人の絵柄が再現できるはずもない」というのは間違いではないでしょうか?
参考1:https://prtimes.jp/main/html/rd/p/000000051.000100410.html
参考2:https://note.com/mioha_0308/n/n3b9a40b2c08c
参考3:https://w.atwiki.jp/genai_problem/pages/18.html
-----------------
(引用) ある者はGlazeやらNightshadeやらで絵を汚すことで安心(=プラセボ効果)を得ようとし、(引用終わり)
GLAZEについては、単にそれっぽいノイズを加えるのではなく、Style transferを行うことで、生成AIにスタイル特徴の特徴空間を誤認させるものだという理解をしています。
実際に論文中でも、スタイルを誤認させることに成功しています。
これはAdversarial Attackのように、人間には一見同じように見える画像でも、生成AIには全く異なるものに見えるように画像を変換しているものだという認識です。
GLAZE, Nightshadeを実際に検証した記事を見てみると、たしかにLowフィルターだけを使用した場合にはあまり効果はなさそうですが、Highフィルターを使用した場合には一定の効果はあるように見えます。
(Lowフィルターだけをかけても効果が薄いという主張であれば、賛同します)
参考1:https://qiita.com/heart_mugi/items/aa88e78add3ee138858a
参考2:https://tech.preferred.jp/ja/blog/nips17-adversarial-learning-competition/
参考3:https://qiita.com/miu200521358/items/81439ba159d836faa0f4
-----------------
今回の騒動はGrok学習への対応策の話であって Loraじゃねえよ Loraに意味あることくらいはわかってんだよ 大層な肩書きひっさげて筋違いなこと書くな
横からだが引用部分の元増田はそもそもの話ししてるからお前が的外れじゃね?
横からだがそんなことはないぞ
元々の文章では「そもそも深層学習の構造を考えると」のように記載されています。 これは、Xのプライバシーポリシー変更の件に関係なく、そもそもの一般的な深層学習についての主張...
正面から失礼します w
後ろからだが俺もそう思う 反AIというか絵師叩きしてるやつは絵師の無知を笑う割に学習の意味をその時々で都合よく変えすぎ
Xの学習の話なのになんでLoRAの話になるの?
確かに事の発端となったのはXのプライバシーポリシー変更の件ですが、そもそも絵師の主張の多くはGrokに限った主張ではなく、生成AI全般に対する主張となっています。 また、「AIアレ...