はてなキーワード: 著作物とは
生成AIに関して詳しく書いてある文章があったので、興味深いと思って読みました。
ttps://note.com/freena_illust/n/ne1442b0563c3?sub_rt=share_b
返歌ではありませんし、技術的根拠も出せませんが、思ったことをまとめたいなあと思いました。
断っておくと、上記の記事に対して肯定的な感情を抱かなかった人が書いてます。
そして生成AIはChatGPTを無料でしか使ったことがない人が書いてます。
嫌な予感がする人は読まないほうがいい。
冒頭で書いたように私は生成AIに詳しくはありません。
でも一応話の軸がぶれないように、最初に主張したいことを述べます。
「高精度なAIには大量の学習データが不可欠だから、権利問題をクリアしても未来はなさそう」です。
先日びっくり発言を見かけました。
曰く、生成AIの技術を認めている人はすべからく盗作を認めている(意訳)、とのことでした。
現在の生成AIツールがそうなっているだけなので、学習元を変えれば権利侵害にはならないはずです。
まあ技術的に可能というだけで実際にそうする人はいないと思いますが。
権利の問題が解決されていないのに生成AIのツールばかり絶賛するものだから、生成AI賛成派は著作権を踏み倒していると解釈されるのは理にかなっているとも思います。
先に述べたように、私は生成AIに限らず、AIという技術が発達すればいいなと思っています。
がしかし、問題があるとすればAIという技術には膨大な学習データが必要で、ネット上にある膨大なデータは全てが著作権フリーではないということです。
さて、件の記事では「無許可のデータを学習」という文がありました。
ふと思ったのですが、逆ならいいのでしょうか。
ですが、「許可されたデータ」の数とはどれほどなのでしょうか。
それで生成できるコンテンツとは何なのでしょう。
ニューラルネットワークの階層が極端に少なく、陳腐なものが成果物となるでしょう。
法で「許可されたデータ」のみを学習対象とするように律することは出来たとしたら、AIの未来はないと思います。
理由は当初に述べたとおりです。
機械学習の本を読んだら寝たので諦めましたが。
それで、だいぶ路線が違うのですが、過去に形態素解析をかじっていたころがありました。
その際に「データ量が少ないと何もできないな」ということを痛感しました。
形態素解析というのは文章をスパスパ区切って順位付けなり分類なりをするというものです。
その文章をスパスパ区切るために、単語の分類と区切りが記載されているであろう「辞書」が必要になります。
「今日魔界ではどちゃくそ雪が降った」という例文があったとして、
単語量の少ない辞書では「今日/魔/界/では/ど/ちゃ/くそ/雪/が/降った」
単語量の多い辞書では「今日/魔界/では/どちゃくそ/雪/が/降った」
になる、というかんじ。
イメージ図なので本当に魔界が分割されるかはわかりませんが、固有語はほとんど未知の単語と認識されて分解されると思います。
無料に頼るからよくないのですが、ネット上の無料の辞書は単語量が少ないため、現代風の言い回しがだいたい判別できません。
ボボボーボ・ボーボボなんてこようものなら、もはや人名とすらも認識されません。
いやどっちかというとマンガ名か?
いいかんじにメンテされてた辞書も、とある日を境に更新されなくなってしまいました。
そんな具合で、当時はデータ量が少ないと何もできないなあと、役に立たねえなあとひしひし感じました。
先ほどの無許可、許可のことを書きながら、このデータ量のことを思い出しました。
文章生成AIであれば、学習する際、単語を分割したり重みづけをしたりする際に相応の辞書を使っているはずです。
要はデータ元もそれを補助するツールも、多くのデータがあればあるほど真価を発揮するはずなのです。
フェイク画像やらなにやらが話題になったのは、サムネイル段階で目を引く造形だったからですよね。
その点では遠目で人の興味を惹く成果物を作れるほどになった技術自体は賞賛すべきものだと思います。
でもそれで作られたものって盗作だよね? という声が聞こる気がしますが……。
私も趣味で絵を書いたり文章を書いたりするので、同一のもの、あるいはひどく酷似したものが他者から後出しで出されたらぞっとします。
この手のものはトレパクというものに当てはまりますが、時系列の証拠を出せばおよそどちらが権利を侵害しているかが認められるものだと思っています。
ただ、生成AIでの成果物は本当に権利を侵害しているのか、という疑問はあります。
ttps://note.com/compass_0000/n/na536a5d16c7a
上記の記事はとある絵師さんのトレパク疑惑について書かれたものです。
記事の内容を見ても、この勝訴した絵師さんはトレパク冤罪をかけられたものだと思えたのですが、某SNSで検索をかけて驚きました。
敗訴した絵師さんをかばい、勝訴した絵師さんを非難するような方が多く見られたのです。
しかも裁判が起こるだいぶ前にこのトレパク問題はとても話題になり、「トレパク疑惑」というところがすっぽ抜けて「トレパク」とだけ把握する人が多数いたようです。
つまり、かの絵師さんには「トレパク疑惑の絵師」から「トレパクの絵師」というレッテルが貼られてしまったのです。
そんな先入観からか、はたまたもう片方の絵師さんを妄信しているのか、ふたりを殆ど知らない私ですら妥当と思った判決結果に疑問を抱く人が世の中にいます。
証拠がはっきりしているトレパク裁判ですら、すべての人が納得出来ていないのです。
(なんでだろうね)
トレパクではしばしば線の重なりが証拠として出されますが、生成AIでの盗作の証拠とは何なのでしょうか。
私の作品を学習してると思います、という見知らぬ絵師さんの引用投稿を以前見かけたことがあります。
こことこことここがその証拠です、と赤丸をつけていた記憶があります。
決して私も詳しいわけではありませんが、かの絵師さんは生成AIの生成過程をご存じないのでは、と思いました。
1枚の絵が与える影響がそんなに大きいとは思えません。
ノイズを出してから1px単位で要素を除外していく、という過程だけを知っていたらそんな言いがかりはつけないと思います。
今、このような方がどれだけいるか分かりませんが、身を守るのだとしたら敵を知るべきです。
思い込みや無知では戦えません。……と思い込みでこの文章を書いている私が言うのも説得力がありませんが。
絵柄を寄せて作り出した成果物であれば話は別です。
あえて特定の絵柄に寄せ続けた成果物を作ることで、模倣元の著作者が得るはずだった利益を奪い取ったと訴えることが可能と考えます。
が、この場合も似ている絵柄などごまんとある、という反証が出来てしまうのかなとも思います。
「学習したことの証拠」よりは「模倣したことの証拠」のほうが敷居が低そうではありますが、それでも茨の道ではあります。
逆に言えば証拠らしい証拠を出せないのが生成AIなのかもしれません。
裏はブラックボックスなので……。仮に問い合わせて計算データ云々を入手できたとしても数値の羅列でしょうし。
現状では、生成AIの成果物は盗作疑惑が永遠に付きまとう、という認識にしかなりえないと思います。
盗作じゃないって証明でないならいいじゃーんって開き直る人がいそうですが、グレーゾーンって喜んでいいのかなあ……。
「高精度なAIには大量の学習データが不可欠だから、権利問題をクリアしても未来はなさそう」です。
データがたくさんあればAIという技術の発展が見込めるけれど、それには権利の問題が立ちふさがる。
仮にそれが権利者の権利を守る段階に来たらAIの発展は終わる。
でも、現状の生成AIの成果物は権利侵害をしているともしていないとも言い切れないのでは?
そう思っています。
NFTがいい例ですが、著作権を持っていたとしても物理的には何の意味もありません。
権利持っている人以外スクショできる機能なんてスマホにはありませんし。
絵を描いたのならばAI学習疎外ツールを使って自己防衛する時代になっています。
正直、盗作盗作いう人たちの決めつけ発言に辟易しますが、グレーゾーンであることは変わりませんし、この先白か黒かに変わることもないと思います。
そうです、私はAIという技術が気になっているだけあって、生成AI技術=盗作ツールというレッテルが貼られるのが嫌だなあと思ってるだけです。
今現在は否定できる証拠もないので、断言はできないでしょ! としか言えないのですが。
AIがうまーく発展してる未来のフィクションはどうやって高精度で大容量なデータットの獲得と権利問題を解決したのでしょう。
フィクションに聞いてもわかりませんね。
そうそう思い出した。
DXが進んだのはコロナの影響という話を以前聞いたんです。
企業がちまちまやっている業務効率化や働き方改革なんてちっとも効果がなくて、COVID19が一番の功績者だったと。
その部分はただの皮肉でしたが、事実でもあるので、人間って環境が変わるとそれに対応していくんだなあとつくづく感じました。
とはいえ、今回話題にしている生成AIはおよそ画像生成AIのことを指しているので、環境変化によって必要に迫られることはないと思います。
何に使うんだろう。
気にはなってるけど傍観者なもんで……。
なんかこう、心理学に似てるような……一般人は何に使うんだろうってなる……専門家は分かってそう……。
技術の発展って難しいですね。
ペンタブで描いたものよりアナログの絵が賞賛されたように、ハイテクはすごい、という先入観があるのかもしれません。
すごいからずるい、になるんでしょうね。
障害があって絵が描けない人が生成AIで絵を出せるようになったという話を見たとき、そういう人もいるのかと感心しました。
乱数要素も絡むため、著作物であると主張できるかはさておいて、想像したものを出力できるのは楽しいと思います。
……使ったことないですけど。
現時点で、画像生成AIは「無断学習」を根拠に一部のクリエイターたちから蛇蝎のごとく嫌われてて企業PRでAIを使うだけで苦情が殺到するレベルになってきてる
ただそれは倫理的な検討を重ねてというより「自分の絵が知らない間に学習されてるのはなんかキモチワルイ」という感覚的な嫌悪感によるところがかなり大きい
Googleはもともとサイトのデータを勝手にスクレイピングしまくって検索サイトとか翻訳サービスとか作ってきたのだが、そういうのには文句がいかないあたり、著作物を学習することそのものは焦点じゃない
チャットGPTみたいなテキスト生成には甘かったりするし、人によっちゃ漫画の改変コラという直球の著作権侵害をかましながら生成AIに反対してたりするんだからね
よって、現時点は画像生成AIに反対しているクリエイターたちも「なんか大丈夫っぽい」と判断しだしたらゆるゆるその機能を使い始めるだろう
本質的には同じ問題を抱えていても感情的に受け入れられるかどうかのほうが重要だから
じゃあどのラインからクリエイターは画像生成を受け入れだすか?
まず、画像を含む生成AIの開発がここから止まることはほぼありえないと断言できる
マイクロソフトもGoogleもAIに巨額の資金をベットしてしまったしもう引き返せない
多少強引にゴリゴリ進めながら落とし所を見つけていく腹積もり
当然反発もあるし、完全無視はできない
OpenAIやらMidjourneyやらは大量の訴訟を相手にしてる
大まかに言えば全部「うちのデータを勝手に食って売り物にしてんじゃねえよ」という内容だ
落とし所はおそらく「学習元に利益のいくらかを分配します」「違法なデータは言ってくれたら削除します」「生成AIの出力から学習したデータで学習をするのでクリーンです」あたり
そうなると、最初に和平条約を結んだところは生成AIの進化を後押しする側に回るから風向きが変わっていくはず
並行して、AIが仕事で手放せないくらい便利になってさらに風向きが変わる
GoogleやAmazonがいかにEvilな行為をしているかは調べればすぐわかる
でも使うのをやめられないのは便利だから
逆にいうと、今画像AIが叩かれてるのは本職の絵師にとって大して便利じゃないからっていうのがでかい
絵描きにとって便利な機能が出てくれば評価はかなり変わってくる
たぶん最初に使われるは色塗りとか、壁や床のテクスチャ生成あたりからだろう
AIによる画風の再現とかは今後も「魂を傷つけられた」「自分の作品も勝手に使われてそうでキモチワルイ」と感じる人が多い
だから単純作業っぽい工程がAIで代替できる仕組みから浸透し始める
それだって結局はどっかから勝手に引っ張ってきたデータをミキサーで混ぜて作ったデータだという意味では同じなんだけど、あくまでこれは感情の問題だからね
大量に絵を作らなきゃいけないソシャゲ絵師とか同人作家がおずおず使い出したらあとは早くて、構図からポーズから、かなりの部分をAI任せにしてもなんも言われなくなる
その頃には「(一応)(自称)クリーンなデータセット」みたいなものの定番も存在するはず
この段階に来ると絵描きの倫理観は「補助として使う分にはどう使ってもOK」「特定の絵柄の再現をやるのはNG」って線引きになってると思う
そんでさらに時間が経つと、外部思考装置としてのAI生成が当たり前になって、ただの思考と区別されなくなる
(現代人がスマホでできることも含めて人間の能力だと思っているのと同じ)
生成AIに学習されたとき「魂の一部を盗まれた」と思う感覚がだんだん時代遅れになって、著作権の観念ごとゆっくり曖昧になる
ストレートに実現するかはともかく、ビッグテックがやろうとしてるのは倫理観の書き換えそのものだと思う
どうなっちゃうんだろうね今後
「弱者をおとしめる笑い」
生成AIの学習と人間の学習は同じだから何が悪いんだ!ラッダイト!というはてな民が多いので簡単に解説する。
まぁ、どうせ届いてほしい人には届かないのだけれど。
大きく3点だ。
3. 倫理観
人間がその道を学習しようとしたらどの程度の時間がかかるだろう?
人によるが、例えば言語の習得であれば、480時間から1000時間と言われている。イラストや音楽であれば、学校に行ったり日々練習したりそれなりのものを再現できるようになるまでに数年かかるだろう。
対して生成AIが学習するには素材と環境があれば、ものの数時間から数日で終わる。ファインチューニングのレベルによっては数分もかからない。
疑惑が過去にあったが、下書きをちょっと公開しただけ生成AIに取り込まれ、本物ができあがる前に下書きを元にしたそれっぽい何かが先に生成されるということが実際にできるようになるかもしれない。
さて、あなたは数年かけて、ようやく表現したいものを表現できる腕前になった。いざ表現しようとしたらそれはどれくらいかかるだろう?
例えば週刊のマンガであれば16-20ページを1週間に書いている。アシスタント付きでだ。1枚のイラストでも数時間から数日はかかるだろう。
対して生成AIが1枚のイラストを生成するのにかかる時間は一般的なPCで1分以内だ。
しかも一度学習さえしてしまえば、構図を変えて何枚でも短時間に生成できる。
あなたがクリエイターだとして、あの有名なクリエイターの作品みたいなものがほしいとクライアントに言われたときにあなたはどうするだろうか?
人間は学習コスト、再現性、周囲からの評価、法律などを鑑みて、雰囲気は似ているだろうが全く同じものを生成することはないだろう。
仮にそっくりな贋作を作れたとして、それを公開するだろうか?その社会的評価は?その後のあなたのキャリアは?
対して生成AIには倫理などない。モデルと入力に従い、それらしいものを生成するだけだ。
クリエイターは今まで費やした時間を無駄にしないよう、普通やらないようなことを、生成AIを使った悪意のある第三者はたかが数万で機材を揃えるだけでやりたい放題だ。
つまり人と生成AI(コンピュータ)の違いは、圧倒的な時間である。
ひとりの人間に許された「時間」という有限のリソースを費やして、学習し、生成できる成果物はそれほど多くない。
人間が模倣しようとしたって学習に時間がかかる、製品の生成についても時間がかかる、倫理的にやらない人もいる。時間が前提条件となっているために、学習したって模倣したってそこまで大きな問題にはならなかったわけだ。これはデジタルコピーの問題に近い。コピーには時間がかかっていたのがデジタル化により無劣化、無制限で再配布ができてしまうという問題である。今も海賊版が問題になっているけど、取り締まりができる範囲だった。
それに対して生成AIの場合、単純なコピーだけでなく、アレンジ、類似品の生成まで簡単にできるようになってしまう。ディープフェイクのような望まないものでも作れてしまう。しかも専門知識なしにだ。
あるオリジナルを模倣して類似品で先に埋め尽くされたら、オリジナルの作者の権利はどうなるだろう?
第三者が生成AIを使用して、自分の成果物を、瞬時にコピー、アレンジ、再配布を、短時間でそれも大量に行えるということがどれほど脅威であるか、人間と生成AIの学習の違いについてわかっていただけただろうか。
なのでAIに学習されたくない人が自分の著作物を学習されない権利はあってもいいと個人的には思っている。
ここ2年でAIを取り巻く環境は大きく変わっている。画像生成だけでも2022年にStable Diffusionですげぇって言いながら、馬に乗った宇宙飛行士を生成して喜んでいたのもつかの間、LoRAやControlNetでより一層好きな絵柄を自由に生成できるようになってきている。 ChatGPTにしても3.5から4へのアップデートで精度やできることが大きく増えている。
加えてラッダイトの1800年代の職業、ブルーカラーメインの時代に比べて移り変わりが激しく、加えて高度に発達した現代でキャリア変更はかなりの難易度があるはずだ。職をいつ失うか予測をたてる時間はあるだろうか?次の職は何がよいだろうか?そもそも転職できるのか?
無邪気に法律が良いと言っているんだ、技術の進歩を邪魔するなと言っている人は、あなたは今まで膨大な時間をかけて構築したスキル、キャリア、成果物を人類の発展のために捨てろと言われて容認できるだろうか?保証もなく働かなくて良い時代もベーシックインカムもまだ来ていないが。
チャット系のAIは学習したデータから、あるキーワードの次に最もくるであろう単語を羅列する。
画像生成系は学習したデータから、ノイズから元の画像はなんであったかを推測して生成する。
現在の生成AIは0から1を生成できない。学習したデータの模倣から生成するしかない。それなのに既存のクリエイターをお気持ちだとかないがしろにするのは良くないということを言いたかった。
私自身は生成AIは使うし、AIはどんどん進歩していって欲しいと思っている。ChatGPT、Copilotは便利だし、ちょっとしたアイコンを作りたいときにStable Diffusionで生成するのは楽ちんだし。本質ではない作業を楽にするのはとてもいいことだ。
例えば3Dモデルを作るのに写真から生成して、テクスチャも作ってくれたらなーとか。Blenderの使い方を勉強したいんじゃなくて、最終的に使う3Dモデルが欲しいのだ。それとは別にプログラマなのでプログラムを手書きしたり、ロジックを考えるのも楽しいので、生成AIでコードを書くことがなくなったら寂しいしおまんま食い上げだなーとか思いつつも、システムを作り上げるというのが楽になるならそれはそれで良いとも思っている。
ただし、それを実現するのに他人の権利をないがしろにしたりするのは違うと思うので、今回の文化庁のガイドラインの取り組みはとてもいいことだと思う。クリーンな学習データを用意して頑張っていただきたい。
というか、あのガイドラインできたの2018年なので、AIといっても最近の生成AIのような成果物が直接でてくるものをそこまで想定してなかったんじゃないかなと思ってる。
例えば2018年のAIの例 https://forbesjapan.com/articles/detail/24830/
その後にStable Diffusionみたいな極端な例がでてきて、何でも学習可はやりすぎたと思っているんじゃなかろうか。
ここ1年くらいChatGPTやお絵描きAIを面白くて触っている。
その中で故あって知る事があったので聞いてくれ。
イラストAI界隈では、イラストレーターがAI画像生成を滅ぼそうと、AI絵師叩きが行われている
Twitterで追いかけていると、AI絵師として熱心に調べては情報発信をしている様な人は、無償で興味本位にやっている人であっても、誹謗中傷で消耗している様子だった。
と、何度も対応しているうちに、消耗して感情的になっているように見えてき始めている。
そこで、どういう状態なのかちょっとTLを追いかけてみたけど「確かになぁ…」と思った。
まず、ここからの話をする前に、お絵描きAIのモデルを作るも公開するのも、法的に基本的に問題はない。
著作権だと、著作物を多数集め情報解析することが法律で認められているのでモデルも合法的に作れる。
そして、出てきた画像に関しても、AIの生成結果を著作権でどう扱うかは人間に準ずるのが国の方針なので、「人間がやったらダメなレベルなものはAIにやらせても駄目」になる。
例えば、誰かの肖像権に触れたり、あからさまにトレスにあたるようなものはアウトになる。
これに関して、法律を変えようと動いている絵師もいるのだけれども、結局は
1.翻訳AIなどで既に行われている様な収集と活用が、お絵描きだけで何が違うのかを説明し、世間に納得させる
2.各手団体と連携して、既に活用されているAIも含め、全ての学習を禁止させる様動く
このどちらかをするしかない。
一縷の望みをかけて勝負をしてもいいけど、基本的にこの議論は決着しているのだと思う。
ただ、今回言いたいのはその事ではなくて、何故、翻訳AIやChatGPTなどではそこまで見かけないような過激なAI排斥論議が、イラスト界隈では1年以上たった今でも燃え続けているのか。その点であったりする。
TLをある日追いかけて、自分なりに2、3晩うんうん唸って考えてみたけれども、
これは、結局は「絵を書く事はとても楽しい」という事に尽きるのだという結論に至った。
例えば他の分野だと、「翻訳」を仕事にしていた人等というのは、翻訳という行為が一番好きなのではなくて、実は「違う国の言葉で違う国の人とコミニュケーションだ取りたい」のが一番したいのだと思う。
そして、その中で自分が覚えたスキルを仕事に生かしたいと思って翻訳を仕事にする人が多いのだと思う。
そして文章や音楽と違って、出てきたものが良いか悪いかの判断が一瞬で出来てしまう。
そういう中で、長年憧れてきて、仕事にしたいと夢見た業界の席が、今急速に萎んでいく様に見えるのが耐えられない。
そういう人達が、AIのクォリティに絶望して、ついに誰かや何かを悪者に仕立て上げないと精神の均衡を保てないで、
あらゆる画像生成AIを撲滅する活動をSNSで行って悪目立ちする状態になってしまっていたりする。
※ 単に絵描きに社会性の低い人の割合が高い部分もあるだろうけど、先述の理由は越えないと思うので触れないでおく。
大変のイラストレーターは将来に戦々恐々としながらも、正当な技術の発展であれば受け入れていくべきだと考えているのだろうけど、
直面した危機感の前に、理屈も何もなく暴れる人が出るのを攻めきれない感情もある。
自分も少しは絵を書いてみた経験はあるので、仕事としてやっていけそうな所まで磨いた腕への矜持も想像は出来る
けど、だからこそ、反転して魔女化してしまっているのは、なんというか、見かけるに、辛い。
※ 余談だけど、個人的に触った感想としては、結局イラストAIは一流の人の技能に追いつく目途は経っていないので、ゲームであればキャラデザをやる様な人達の仕事がなくなるような事は無くて、その人の下の方で色んな変化があるんだろ思う。
ただ、AIでポーズ違いが量産できるようになれば「このウェイトレスのヒロイン。街で合った時も文章で走っているってあるときも、右手にお盆とパフェ持ってるよな」とか「本当は遊園地デートのシーン入れたかったろうけど背景用意できないから時間がワープしたんだろうな」とかが無くなって、ディレクターやシナリオライターがよりやりたかった形でゲームが作れる様になって、それでゲームが面白と感じるようになるなら、それが世の中が良くなるって事なんだと思う。
活投してみて、有効な局面は活用されて、やっぱり人の手で書いた方がいい部分は奇麗に残る様になっていくと思う。
あと生成AIは誰でも覚えられるとは言わないけど、現状の難易度は、HTMLを手書きで書いてホームページを作れるようになるくらいの難易度で、ControlNetなども含めて使えるようになっているし、イラストは技術的成長に関して割と天井が見え始めている。
生成AIでも、一番鍛えるのが難しいのが何がおかしいかを見抜く「目」なので、手書きで修正可能なスキルも含めて考えて、グラフィック担当の人の大部分の雇用は守られていく様に見えている。
ただ、一枚絵をSNSにあげていた人は、これまでのやり方では厳しいので、連作でストーリーを出したり、動かして見せたり、AIも活用しつつ次の価値を見せないと難しくなるので、そういう人達がAI撲滅に熱心な層の柱になっているのだろうと思う。
※余談2
ちなみに、特定の悪例というのが
等の事だ。
ただ、私も問題と思うようなこのような目に余る例は、現行の法律で裁判をしたら勝てるものであったりする、なので現状の国の方針で概ね正しいのだろう。
非クリエイター、画像生成AI(stable diffusion web ui)に触れている(投稿は一切していない)だけの消費者のただのお気持ち投稿です。(反AI寄りです)
また全体的に画像生成AIを批判する内容ですが、画像生成AIを使って画像を投稿している人や記事を書いてる人や金儲けをしている人に突撃するような活動はさすがにダメだと思っています(クマを殺すなと市役所に電凸するようなものと同じと思ってるので)
昨今画像生成AIによる作品が大量に発生してきているためものすごくげんなりしています。DMMやDLsite等を利用している人であれば実感している人が居ると思いますが、これでもかってくらいAIによる生成物が増えてきて明らかに特定の作者まんまの作品がちらほら・・・。また、画像生成AIの進歩が凄いというのを実感する一方でその発信をする人の中に時々pixivのファンイラストの無断使用するとかMMDのモーションをAIでパクっただけ等とAIと関係なく著作権の意識が希薄な人が居てせっかくの技術もこんな使われ方されてかわいそうって思います。
とはいえ、さすがにAIを触る人間の大半がそんな人間ではないだろうとも思ってはいます。賢木イオ氏がアンケートを採った「狙い撃ちLoRAや絵柄模倣、貴方はどう思う?画像生成AIユーザー緊急アンケート」の記事内でも「特定絵師さんの画風再現AI絵」を問題ないと思っているのは1割でアンケートの回答者に関しても世間が「AI絵師」と呼ぶような投稿者は4人に1人以下というものでした。直感的にもそんなものだろうとは思いつつ、画像生成AIの界隈はところどころ不穏な層が結構目立つ。イラストレーターに対して画像を学習したことを直接報告する人とかおそらく犯罪にならないからと反AI層にイキリ散らかすのとか。そんなのがいるもんだからAI推進派の目立つ人(その中でも話が通じる人・まともな人)に粘着したり殺害予告やらと反AIの過激な人も現れていてSNSでは建設的な議論よりもひたすら誹謗中傷ばかり増えて本当に見ていてきついです。
直観的な感覚としては、特定のイラストレーターのデータを学習した上でそのイラストレーターと似たような絵を作成して販売したら著作権の侵害になるのでは?と感じるのだがどうもそうはいかないというのが昨今の流れのようです。
軽く調べただけですが理由として
・著作権の侵害には「類似性」と「依拠性」の“両方“を満たす必要がある
・AI学習そのものは原則として著作権者の許諾なく行うことが可能(権利制限規定として)
といったことがだいたいあげられるのだが
・30条の4には「著作権者の利益を不当に害することとなる場合は、この限りでない。」との但し書きも存在しているため営利的に活動する場合は果たして?
・イラストや同人誌は二次創作の範囲内としてグレーな扱いになるが、グッズの販売はAI関係なく以前から書類送検されている例もあるのでAIだからセーフ論は特に立体物では通じないのでは?
とも思った。
とはいえ中々すっきりしない理由としておそらくは参照すべき背景や歴史や法律の運用等々があるのだろうとも推察されるので素人が口出ししないほうがいいような気もしました。特にAI絵師に「著作権法違反だ!」とかみつくようなものは。トレパク告発もそうですがお前は●●だといった断定するような批判は「真実であろうと冤罪であろうと名誉毀損」になりうるので、問題と思うのなら部外者は違法性が高いと考えうる証拠を保存するだけに留めるのが賢明でしょう。(よく知らない人物に突撃する人がそういった行動をとれるかは微妙ですが)
画像を生成したことでわかったこととして大きかったのが、生成されたまま投稿されたAI生成物(というかただの手抜き)がどんなモデルだったりLoraだったりプロンプトで作られているのか少し予想できるようになりました(私に限らず少しでも画像生成AIに触った人はだいたいできるでしょうが)。そこからまあまあの割合の人は自分と大差ないかそれ以下のレベルに収まっており、私のような人間はあくまでも画像を生成できるサービスを利用している消費者に過ぎないということも実感しました。
また画像投稿サイト「Danbooru」からデータを取り込んでいるとして話題のNovelAIだったりMidjourneyだったりdall-e 3等含めていくつも画像生成AIのサービスが現時点で存在していますが、生成AIを批判している人の中にはこれらの区別がつかない人がまあまあいてなんだかなと思います。複数のサービスに触るとそれぞれのツールが抱える問題と画像生成AI全般における問題を多少は区別して考えられるようにはなるのかなと。
一番大事だと思うこととして「苦手」と言われていた表現のだいたいが数か月したら「可能~かなりいい出来」のクオリティまで引き上げられていることがたくさんあることをリアルタイムで感じることができます。なので画像生成AIが作れない画像がまあまああるというイメージが最初のころはありましたが、今はおそらくほぼ大体の画像を作成できるようになると私は確信しています(画像データの絶対数が少ないものを正確に作る等は苦手なままと予測していますが)。
まず現時点で画像生成AIはパソコンさえあれば元手0円でできるということと、犯罪者としておそらく逮捕されず年間数百万や数千万稼げるというのが完全に嘘ではないというところが厄介と言わざる得ません。好きな漫画家やイラストレーターがいる人間からすると倫理的にどう考えてもダメなのでは・・・・・と感じますが、正直なところ自分も定職に就けず碌な稼ぎを得ることもままならない状況だったらマネタイズに手をだした可能性が非常に高いと思います。
とはいえ、最近のDMMやDLsiteを少しでも眺めている人はわかるでしょうが作成した画像をただ並べた画像集はさすがに売れないようになっているようです。今年の4月ぐらいであれば画像を並べただけでも1000個は販売できたような入れ食い状態でしたが、最近ではその程度では1桁がいいところのようです。とは言うものの11月12月発売の作品でも数千個の売り上げがある作品もまだまだあって、そういう作品はだいたい生成されたものに加筆+セリフ追加+サムネイルを目立たせる といった売れるための努力をしています。作品の絶対数が増え、クオリティの差が目立ってきたことでとりあえず生成AIを使えるだけのレベルに収まっている人は淘汰されていっているということでしょう。されどAIを使って画像を出力するだけで多額の金銭を得ることになれた人が黙って引退するわけもないのでどうにかして利益をひねり出そうと手を変え品を変えガワや看板や提供の仕方を変えて利益を得ようを頑張っているのでどんどん殺伐としてきてますね。本当に。
なにはともあれ「資格」「専門的な知識・教育」「経歴」を必要とせず労力と時間をかけた分だけ金銭が得られる可能性が高い分野はそうそう存在しないため現時点で数百万・数千万の利益を得ているような人からすればAIの規制は死活問題です。どうにかして自分の利益を守ろうとするならAIが著作権違反じゃないと無理のある理由をつけてでも喧伝するのも自然な流れでしょう。
せめて現行法で十分対応できる範囲のものはやってほしいところです。さそりがため先生がトレパク常習犯を刑事訴追した例もありますし、AIだからセーフを信じて過激な行動をしている人に対してはそろそろ何かしらの対応がされてもいいんじゃないかなと期待しています。そもそもAIが登場する以前でも逮捕される様な行動はAI関係なくアウトなはずでは?とは思ってるんですがね。そのうえで非常に大事なことですが、AIを使っているだけの人に殺害予告したりとか犯罪者呼ばわりしたりするのは本当に止めましょう。普通に開示請求通って損害賠償請求までいくので。またAIで俺の絵をパクっただろ系のやつも画像生成した本人が自慢している場合以外はやめましょう。さそりがため先生みたいに明らかにトレパクされているレベルでも刑事訴追まで数年かかってるので立証自体が難しいのと、既に言及してますが真実であっても間違いであっても名誉棄損になりそうなので。
・自分が作成していないものを自分の手書き・撮影したものと偽る
・なんならタイトル以外の文章まるごと自分のものとして投稿する(テラーノベルが無断転載の温床になってましたね)
・本来モザイクがかかっている画像のモザイクを外した画像をだす
といったことをしていた人はAI以前から存在していた。AIは単に自力ではこういったことができないからやらなかった人が行動を起こすための敷居を大きく下げたに過ぎないのではと私は考えています。世の中にはまあまあの数の人が労力と利益に対して罰則や失うものが多いために犯罪や犯罪じゃないが良くないことを実行していないだけで、今回のAIによって労力が限りなく0に下がり一方で得られる利益(金銭だったりネットで話題になる、注目される)が上がってしまった。加えて逮捕されるリスクも低い(そう言われているだけで実際にそうかは別)と言われたら犯罪者未満~一般人程度に含まれる人がこぞって暴れ始めたのだろう。文化庁含め画像生成AIにおける著作権の問題が各地で巻き起こっているけども、「簡単にできるが逮捕されない」ということを信じて行動する人がたくさんいることをどうにかしないと何も変わらないと思います。今はまだそれなりのパソコンを使っての作成や有料
サービスを利用しての画像生成が主流ですが、スマホでの作成が主流になれば今よりも酷いものになるでしょう。
そのためにも犯罪行為をしたらちゃんと逮捕されるという当たり前の事実を徹底的に広め・認識させるしかないでしょう。
多かれ少なかれ二次創作してる泥棒ばっかなのに何故あんなにもクリエイター気取りなんだろうか?
コミケやSkebみたいな絵師界隈の二次創作放置してきた時点で同罪なのは言うまでもない
同じ学習によって高クオリティな絵を描くAIを泥棒と敵視し、自分達は0から作り上げたと言い張る神経も意味不明
絵師への同情が世間で全く出てこないのは今までの無法っぷりと絵が描けるだけの癖に
割れとかwares知ってる世代て俺と同世代だよ。もう50代よ。おっさんからおじいちゃんに変わるところよ
あたらしい時代についていけませんと声高に叫んでるようなものじゃないか
それにさあ、知財について普段から情報を入れていれば何が保護されて何が保護されないのか当然に知っているべきなんだよもう子供じゃないんだから。おじさんおばさんなんだから
自分の飯のタネだったり自分がいったいどのような権利のもとに活動しているのかだったりそういうことに無知な50代ってどうなのよ
絵柄が画風が保護されない(厳密にいうと絵柄の類似によって他人の著作物に対して自分の著作物の権利侵害だと主張することは極めて難しい)のってもう初歩の初歩じゃん啓蒙書読むだけでわかる話じゃん
服とかのファッションの保護が思ってるより全然ゆるゆるなのとかと一緒で勉強したら最初のうちに驚いとくところじゃん
知財って色々な慣習やら権利の綱引きやら条約やらの制約の上で立法して決まってるものなのでほんのちょっと動かすのも大変
そして来たるAI時代に向けてだいぶ前に日本は相当に自由な方へ舵を切った。法整備が追い付いてない!なんてのをみるとげんなりする。大きな決断をして明確に動かした!ってタイミングあったじゃん。ばっちり整備済みだっつうのよ君らが知らんだけで
「著作物だけでイラストの描き方を学んだ」場合というかだいたいがそうだと思うが、絵の描き方を勉強する過程でサルまねやトレースを行う行為自体は著作権法では制限してない。トレパクとか模写自作発言とか無断転載(+自作発言)くらいの事態が起きたら著作者の権利を侵害した行為として評価がくだる
"画風パクり"が著作権含めどの権利を侵害してるのか?みたいな話は生成AI以前もたまにやってたが、だいたい特定の絵についてトレースや模写をしてなくて"参考にした画風の持ち主の名を騙っていない"ならとくに問題なしという結論が出たはず
他言及でも書いたが一連の流れや動作原理についての資料は漁ってるし、日本の著作権法の条文は何回も参照してる あと科学技術は無謬じゃねえ
引用の要件を満たしているかを検証している段階でこの読み方をされるのはおかしいが、まじめに「完全に支配できるとお思いですか?」という問いに答えるならそりゃそんなわけない
世界情勢や経済を論ずる新書がなにも参考にせず本人の言いぐさだけで書かれてたら「引用してソース出せよ」って思うし、"家庭内"での私的利用によるコピーや"学校"での著作物利用について制限するほど著作権法がキツくないとかそういう基本は押さえてるつもりだが
AIの学習が人間のそれと同じという視点に立って書いており、先に書いた通りAIが引用の要件を満たさない転載を行った扱いなので「AIが」「無断で使用したデータを含む学習モデルで画像出力を行ったことが」「無断で使用されてしまった著作者(または権利保持者)の」「複製権(第二十一条)、公衆送信権等(第二十三条)、翻訳権(第二十七条)のいずれか、または全ての侵害にあたる」かな。AIに対して訴訟を起こすならこうって感じなので「半導体に訴訟起こすとか何考えてんだろ」とは思うが…
“画像“でない場合でも文章も勿論著作物たりえるもので、こちらが「突然画像生成の話」を出した「ヤダヤダ!オイラ自分で描かないけどAIに描いてもらって神絵師になってチヤホヤされたいんだ!!」を文章生成で言い換えるなら「黙らっしゃい!私は自分では原稿用紙1枚すら埋められないが、AIで芥川賞を受賞するのだ!」になるし、じゃあ青空文庫縛りでデータセット作れよ……って話になる
そっすね
動作として"入ってるデータのみ"を使った出力ならば、盛り込んだデータ数に関わらず「引用部分が従である」が成立しないので引用が成り立たないという話。
「学習モデル」って書き方は混乱するか。ここでは生成過程に注目していたので「モデルデータ」とかにしたほうが分かりやすいか。後で書くけど「すり替えて」はおらず「学習する段階の話」ではない
AIは新たに自分の頭で考えた要素を付け足さず、モデルデータから選んで切り貼りする以上の動作を行っていないので「著作物を引用した新たな著作物」とは言えず「転載物の集合体」として扱える(と考える)。モデルデータの中身が全部無断で使われた著作物なら、モデルデータの中身が6組なら無断転載6件、100億組なら無断転載100億件ってこと
なんで引用かそうでないかを考えたのかは「引用が成立するなら権利侵害ではない」は無断転載か検証するにあたりだいたい確認するから
多分「学習と引用をすり替えてる」前提に立ってこれを書いてて、かつ「AIの学習は人間の学習と同じ」にこちらが乗っかったからめちゃくちゃ面倒くさいことになってると思うので、もう「AIの指す"学習"と人間のやる勉強とかの学習は全く別」って観点で話進めるね
「著作物だけでイラストの描き方を学んだ」場合というかだいたいがそうだと思うが、絵の描き方を勉強する過程でサルまねやトレースを行う行為自体は著作権法では制限してない。トレパクとか模写自作発言とか無断転載(+自作発言)くらいの事態が起きたら著作者の権利を侵害した行為として評価がくだる
"画風パクり"が著作権含めどの権利を侵害してるのか?みたいな話は生成AI以前もたまにやってたが、だいたい特定の絵についてトレースや模写をしてなくて"参考にした画風の持ち主の名を騙っていない"ならとくに問題なしという結論が出たはず
じゃあ「生成AIは画風パクりだからセーフやろ」という話が上がってくると思うが、これは先に上げた「転載物の集合体」であることを考えれば"画風パクり"とは全く違うものであるので、画風という観点で判断してはいけない
AIに便宜上"学習"(Training)って言葉を使っているのでややこしいのであって、いわゆる学習モデルも実態は「入力パラメータ用ファイル集」なので"学習の成果"とは意味合いが違う
かなり前の方の増田でやった「学習モデルの再頒布禁止」という話については「生成AIを動かすために学習モデルを作る」ことは権利侵害にあたらないが「無断転載素材入り学習モデルの頒布」はガッツリ権利侵害だぞって話(これに"学習"って言葉つけないといけないからややこしい)
ただ生成AIのシステムもコンピュータープログラムである以上「プログラム動作時のデータ処理の流れを追うログ出力コードを盛り込むことは不可能」なんてことはない
だからそんなことできないの
まさかそちらから具体的なアルゴリズムの名前を出してくるとは思わなかった
ニューラルネットワーク(以下NN)の内部動作は、人間が指示を出してNNから返された出力を見て「どんな考え方したらこんなアイデア出てくるんだよ思考回路マジわからん」というのがだいたいなので、これも便宜上「ブラックボックスだね~」と言っているにすぎない
NNがたとえば古代アステカ文明の遺跡から発掘された謎の箱をパソコンに繋いだらAIになったとかいう代物なら間違いなくブラックボックスと呼んで差支えない
だが実態は"アルゴリズム"なので、NNはなんでも作れる不思議な箱ではなく、入力層・多層の中間層・出力層を設けた計算手順にすぎない。NNの参考書読んで人力で計算しても(時間かかるし高難易度関数のオンパレードだが)再現可能ではある
参考にしているStableDiffusionも動作原理もアーキテクチャも明らかなので、人間に再現不可能なブラックボックスではない。プログラムを実装してるのがエリートのプログラマであるってだけの人間だし
この言い方では「人間がそう指示を出せば"既存の絵とそっくり"な出力ができる」から事例次第では権利者が訴え出られるとも考えられる
動作として"入ってるデータのみ"を使った出力ならば、盛り込んだデータ数に関わらず「引用部分が従である」が成立しないので引用が成り立たないという話。
意味わからんのだけど、著作物だけを学習させることが問題ってことか?著作物以外の要素が入ってればセーフ?
それ、著作物だけでイラストの描き方を学んだイラストレーターは著作権違法ってことになるけど大丈夫か?
ただ生成AIのシステムもコンピュータープログラムである以上「プログラム動作時のデータ処理の流れを追うログ出力コードを盛り込むことは不可能」なんてことはない
だからそんなことできないの
ニューラルネットが内部でどう動いてるかなんてのは未だにブラックボックスなわけ
分からないなら黙ってろよ