2023-12-22

生成AI学習人間学習の違い

生成AI学習人間学習は同じだから何が悪いんだ!ラッダイト!というはてな民が多いので簡単解説する。

まぁ、どうせ届いてほしい人には届かないのだけれど。

大きく3点だ。

1. 学習コスト

2. 生成コスト再現性

3. 倫理観

1. 学習コスト

人間がその道を学習しようとしたらどの程度の時間がかかるだろう?

人によるが、例えば言語習得であれば、480時間から1000時間と言われている。イラスト音楽であれば、学校に行ったり日々練習したりそれなりのもの再現できるようになるまでに数年かかるだろう。

対して生成AI学習するには素材と環境があれば、ものの数時間から数日で終わる。ファインチューニングレベルによっては数分もかからない。

疑惑過去にあったが、下書きをちょっと公開しただけ生成AIに取り込まれ、本物ができあがる前に下書きを元にしたそれっぽい何かが先に生成されるということが実際にできるようになるかもしれない。

2.生成コスト再現性

さて、あなたは数年かけて、ようやく表現したいもの表現できる腕前になった。いざ表現しようとしたらそれはどれくらいかかるだろう?

例えば週刊のマンガであれば16-20ページを1週間に書いている。アシスタント付きでだ。1枚のイラストでも数時間から数日はかかるだろう。

対して生成AIが1枚のイラストを生成するのにかかる時間一般的PCで1分以内だ。

しかも一度学習さえしてしまえば、構図を変えて何枚でも短時間に生成できる。

3.倫理観

あなたクリエイターだとして、あの有名なクリエイター作品みたいなものがほしいとクライアントに言われたときあなたはどうするだろうか?

人間学習コスト再現性、周囲から評価法律などを鑑みて、雰囲気は似ているだろうが全く同じものを生成することはないだろう。

仮にそっくり贋作を作れたとして、それを公開するだろうか?その社会的評価は?その後のあなたキャリアは?

対して生成AIには倫理などない。モデル入力に従い、それらしいものを生成するだけだ。

クリエイターは今まで費やした時間無駄にしないよう、普通やらないようなことを、生成AIを使った悪意のある第三者たかが数万で機材を揃えるだけでやりたい放題だ。

まとめ

まり人と生成AIコンピュータ)の違いは、圧倒的な時間である

ひとりの人間に許された「時間」という有限のリソースを費やして、学習し、生成できる成果物はそれほど多くない。

人間模倣しようとしたって学習時間がかかる、製品の生成についても時間がかかる、倫理的にやらない人もいる。時間が前提条件となっているために、学習したって模倣したってそこまで大きな問題にはならなかったわけだ。これはデジタルコピー問題に近い。コピーには時間がかかっていたのがデジタル化により無劣化、無制限で再配布ができてしまうという問題である。今も海賊版問題になっているけど、取り締まりができる範囲だった。

それに対して生成AI場合、単純なコピーだけでなく、アレンジ類似品の生成まで簡単にできるようになってしまう。ディープフェイクのような望まないものでも作れてしまう。しかも専門知識なしにだ。

あるオリジナル模倣して類似品で先に埋め尽くされたら、オリジナルの作者の権利はどうなるだろう?

第三者が生成AI使用して、自分成果物を、瞬時にコピーアレンジ、再配布を、短時間でそれも大量に行えるということがどれほど脅威であるか、人間と生成AI学習の違いについてわかっていただけただろうか。

なのでAI学習されたくない人が自分著作物学習されない権利はあってもいいと個人的には思っている。

産業革命以上に、ソフトウェア進歩の速度が速すぎる。

ここ2年でAIを取り巻く環境は大きく変わっている。画像生成だけでも2022年にStable Diffusionですげぇって言いながら、馬に乗った宇宙飛行士を生成して喜んでいたのもつかの間、LoRAやControlNetでより一層好きな絵柄を自由に生成できるようになってきている。 ChatGPTにしても3.5から4へのアップデートで精度やできることが大きく増えている。

加えてラッダイト1800年代の職業ブルーカラーメインの時代に比べて移り変わりが激しく、加えて高度に発達した現代キャリア変更はかなりの難易度があるはずだ。職をいつ失うか予測をたてる時間はあるだろうか?次の職は何がよいだろうか?そもそも転職できるのか?

無邪気に法律が良いと言っているんだ、技術進歩邪魔するなと言っている人は、あなたは今まで膨大な時間をかけて構築したスキルキャリア成果物人類の発展のために捨てろと言われて容認できるだろうか?保証もなく働かなくて良い時代ベーシックインカムもまだ来ていないが。

チャット系のAI学習したデータから、あるキーワードの次に最もくるであろう単語を羅列する。

画像生成系は学習したデータからノイズから元の画像はなんであったかを推測して生成する。

現在の生成AIは0から1を生成できない。学習したデータ模倣から生成するしかない。それなのに既存クリエイターお気持ちだとかないがしろにするのは良くないということを言いたかった。

蛇足

私自身は生成AIは使うし、AIはどんどん進歩していって欲しいと思っている。ChatGPT、Copilotは便利だし、ちょっとしたアイコンを作りたいときにStable Diffusionで生成するのは楽ちんだし。本質ではない作業を楽にするのはとてもいいことだ。

例えば3Dモデルを作るのに写真から生成して、テクスチャも作ってくれたらなーとか。Blenderの使い方を勉強したいんじゃなくて、最終的に使う3Dモデルが欲しいのだ。それとは別にプログラマなのでプログラム手書きしたり、ロジックを考えるのも楽しいので、生成AIコードを書くことがなくなったら寂しいしおまんま食い上げだなーとか思いつつも、システムを作り上げるというのが楽になるならそれはそれで良いとも思っている。

ただし、それを実現するのに他人権利をないがしろにしたりするのは違うと思うので、今回の文化庁ガイドラインの取り組みはとてもいいことだと思う。クリーン学習データを用意して頑張っていただきたい。

というか、あのガイドラインできたの2018年なので、AIといっても最近の生成AIのような成果物が直接でてくるものをそこまで想定してなかったんじゃないかなと思ってる。

例えば2018年のAIの例 https://forbesjapan.com/articles/detail/24830/

その後にStable Diffusionみたいな極端な例がでてきて、何でも学習可はやりすぎたと思っているんじゃなかろうか。

  • ラッダイト運動を引き合いに出してるから当然知ってると思うが、家内制手工業から工場の大量生産に置き換わった時も一緒なんだよ。 今まで職人が何年も弟子入れし、何十年と技術を...

  • 純度100%のお気持ちラッダイトじゃん。反AIってこんなんばっか。 時間が早いことが罪ならCopilotどころかプログラミング言語とか使わずに手で論理回路配線しろよ。 「学習されない権利...

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん