2024-11-15

「反AI絵師様たちの集団自滅記念日」に対するMLエンジニアから反論

機械学習エンジニアとして働いている者として、何点か賛同できない点があったので個人的な主張を述べておきます

深層学習モデル作成経験はありますが、いわゆる「GenAI」の動向を詳しく追っているわけではなく、GenAIエンジニアでもありません。

ですので、私の解釈が間違っている場合にはコメントをもらえますと幸いです。

その際には根拠となる文献をご提示いただけますと幸いです。

-----------------

(引用) そもそも深層学習構造を考えると、億単位画像学習している基盤モデル自分作品が数十枚食われた程度で、個人の絵柄が再現できるはずもない。(引用終わり)

イチから学習させる場合には確かにそうですが、悪意ある一般ユーザーの多くが行うのはLoRAであり、これは汎用的な生成AIに数十枚の特定スタイル画像を追加学習させることでファインチューニングを行うものだという認識です。

これには数十枚の画像があれば十分なので、「個人の絵柄が再現できるはずもない」というのは間違いではないでしょうか?

参考1:https://prtimes.jp/main/html/rd/p/000000051.000100410.html

参考2:https://note.com/mioha_0308/n/n3b9a40b2c08c

参考3:https://w.atwiki.jp/genai_problem/pages/18.html

-----------------

(引用) ある者はGlazeやらNightshadeやらで絵を汚すことで安心(=プラセボ効果)を得ようとし、(引用終わり)

GLAZEについては、単にそれっぽいノイズを加えるのではなく、Style transferを行うことで、生成AIスタイル特徴の特徴空間を誤認させるものだという理解をしています

実際に論文中でも、スタイルを誤認させることに成功しています

これはAdversarial Attackのように、人間には一見同じように見える画像でも、生成AIには全く異なるものに見えるように画像を変換しているものだという認識です。

GLAZE, Nightshadeを実際に検証した記事を見てみると、たしかLowフィルターだけを使用した場合にはあまり効果はなさそうですが、Highフィルター使用した場合には一定の効果はあるように見えます

個人的には、これは無意味ではないと考えています

Lowフィルターだけをかけても効果が薄いという主張であれば、賛同します)

参考1:https://qiita.com/heart_mugi/items/aa88e78add3ee138858a

参考2:https://tech.preferred.jp/ja/blog/nips17-adversarial-learning-competition/

参考3:https://qiita.com/miu200521358/items/81439ba159d836faa0f4

-----------------

以上の観点を踏まえて、私は次のように考えています


これらの私の考えも「コロナワクチン時の陰謀論のような、エセ科学で吹き上がるデタラメ」のようなものでしょうか?

  • 今回の騒動はGrok学習への対応策の話であって Loraじゃねえよ Loraに意味あることくらいはわかってんだよ 大層な肩書きひっさげて筋違いなこと書くな

    • 横からだが引用部分の元増田はそもそもの話ししてるからお前が的外れじゃね?

      • 横からだがそんなことはないぞ

        • 元々の文章では「そもそも深層学習の構造を考えると」のように記載されています。 これは、Xのプライバシーポリシー変更の件に関係なく、そもそもの一般的な深層学習についての主張...

          • 正面から失礼します w

            • 後ろからだが俺もそう思う 反AIというか絵師叩きしてるやつは絵師の無知を笑う割に学習の意味をその時々で都合よく変えすぎ

  • Xの学習の話なのになんでLoRAの話になるの?

    • 確かに事の発端となったのはXのプライバシーポリシー変更の件ですが、そもそも絵師の主張の多くはGrokに限った主張ではなく、生成AI全般に対する主張となっています。 また、「AIアレ...

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん