はてなキーワード: 模倣とは
既存の法律と不整合な上にそもそも絵柄に著作権を認めようとしても類似した絵柄を持つ作家は他にも多数いるわけで著作権の帰属を明確に出来ないために不可能
世に出した時点で誰でも学習させることが出来るので取締コストが無限大に近く実質的に不可能、そして有限のリソースを割いて取り締まろうと作家の怒りが個人的にスッキリするぐらいの効果しかなく明らかに費用対効果に見合わない。建前的に税金で運営されてる警察にイラストのAI学習を取り締まれとか世論が納得するわけがない。
大体無差別に学習したモデルで学習させたかの立証は困難だろうし、Loraみたいな特定の学習をしたモデルであっても海外では違法ではないしそれをDLして使えばいいだけなので意味がない。Lora全般の使用を禁止するのも根拠がないし、特定のLoraモデルが学習禁止対象のものを使用したものかどうかユーザーが判断するのも困難だし使用したところで何らかの明確な損失が発生するわけでもないのでこれを取り締まるのも明らかにやり過ぎである。
イラストにしろ音楽にしろ、そもそも模倣から始まるのは人間の宿命ではある。言語からして親をはじめとした他者の真似事によって習得するもの。
で、それとAI学習と何か関係あるの?JavaとJavaScriptを同列してなんか語った気になってるみたいなやつ?それで?
AI学習は著作権法30条の4で合法なんだが? の言い分は1000回くらい見た。まあ実際そうなんだけどさ、合法なら世間に許容されるとは限らないよね。
転売行為がそう。買ったものをそれ以上の値段で売る、これは合法であり咎められる理由はない(場合によっては違法です)。のだが、社会的には迷惑行為扱いであり転売屋はボロカスに罵られるのが常である。様々な理由から違法でなくとも、他者に害であると認知されればそうなるのだ。
昨今のAI技術と転売には共通項がある。「誰でも簡単に扱えるようになった」ことだ。スマホ一つでメルカリから転売できることであらゆる商品に転売屋がむらがるように、生成AIで簡単に作れることでフェイク画像や声の模倣、絵柄の模倣なんかがどんどこ増えている。AI学習の害が実例として広まりつつある。
少数なら見過ごせる行為も、閾値を超えれば対策をとらざるを得ない。メーカーや店舗は転売対策にコストを割かれ、真っ当な購入者は不便を強いられることもある。
さすがにAI学習と転売行為がまったく同じだとは思わないよ、例え話。とはいえ重要なのは、合法であってもやりすぎたら世間から忌避されるよ、ということ。
忌避しても合法で押し通されるなら、利用される側は勝手に対策をはかることになる。現に絵描き間ではスクレイピング対策として画像に微細なノイズ処理をかける行為が広まりつつある。いずれネットにあがるデータはそうした処理が自動で施されるようになるかもしれない。そうなったら誰も得しないんじゃない?
日本政府の画像生成AIに対する現在のスタンスを問題視する人たちは、主に
の2点を主張している。
ここで、その問題提起が受け入れられ、「画像生成AI規制法」が制定されることを想像しようと試みた。
しかし、ネットで共感を集めている主張は「なぜ画像生成AIは悪なのか」という話ばかりで、「どのように規制すべきか」の話をほぼ誰もしていないことに気付き、途方に暮れてしまった。
まず①について、「絵柄をどう保護すべきなのか」が分からない。
②については、「追いつかないことにどう対処すべきなのか」が分からない。
ぜひ、皆が考えた最強の「画像生成AI規制法案」を教えてほしい。
追記:
確かに前提から間違ってたかもしれない。絵柄に関係なく、無断学習そのものを規制すべきという立場の人も相当数いる。
とはいえ、そういう立場からも具体的な規制案はあまり見かけないから、この場で教えてほしい。
YN0001 絵柄の規制を狙ってる人は少ないのにそこに争点があると見せかけた絵師叩きでしょ。この人いい加減にしなよ。絵師は勝手に学習されない権利、学習時の許諾を求めてる人が多い
争点を見誤ったのはこちらの落ち度だけど、むしろ自分は非建設的な対立煽り/絵師叩き増田にうんざりして書き散らしたわけで、絵師を叩くつもりは一切ない。
>それでも違法とするならば人間絵師の絵も「似た絵」をアウトにする変更が必要になります
いや、だから、君は誰?
「AIによる模倣」も「人間絵師による模倣」も同様に損害を被るか否かを判断するのは、その真似された絵の権利者達です
何の権利もない人が横から出てきて、それならば人間絵師の絵もアウトにする必要があります!って、それは誰のための理屈?誰のためにアウトにしたいの?
「もし無人島にひとつだけ持ってくなら」の元ネタ探求をしましょうね
いくつかバリエーションがある
「無人島に[本]をn個だけ持っていくなら?」
……のような
[本]の場合に「聖書」という回答が西洋でメジャーなことから、元ネタは日本以外なのだろうとあたりをつける
調査の初手はとりあえずこれ
Desert Island Discs - Wikipedia
Desert Island Discs is a radio programme broadcast on BBC Radio 4. It was first broadcast on the BBC Forces Programme on 29 January 1942.[1]
Each week a guest, called a "castaway" during the programme, is asked to choose eight audio recordings (usually, but not always, music), a book and a luxury item that they would take if they were to be cast away on a desert island, whilst discussing their life and the reasons for their choices.
Desert Island Discs は、BBC Radio 4 で放送されているラジオ番組です。1942 年 1 月 29 日に BBC Force Program で初めて放送されました。
番組中「漂流者」と呼ばれるゲストは毎週、8 つの音声録音 (通常は音楽ですが、常にそうとは限りません)、本、そして船で漂流された場合に持っていく贅沢品を 1 つ選ぶよう求められます。 無人島での生活とその選択の理由について話し合います。
このラジオ番組の存在から1942年時点で「あるあるネタ」であることは確認できる
アメリカの一コマ漫画で「無人島もの」というジャンルが存在する……が、それが特に流行ったのはだいたい19世紀初頭頃の出来事なので"Desert Island Discs"とそう時代は変わらない
普通に考えれば『ロビンソン・クルーソー』以降なのよ
『ロビンソン・クルーソー』は1719年4月25日に出版された
これが売れて多くの人に読まれたからこそ"Robinsonade"というジャンルまで生まれた
Robinsonade (/ˌrɒbɪnsəˈneɪd/) is a literary genre of fiction wherein the protagonist is suddenly separated from civilization, usually by being shipwrecked or marooned on a secluded and uninhabited island, and must improvise the means of their survival from the limited resources at hand. The genre takes its name from the 1719 novel Robinson Crusoe by Daniel Defoe. The success of this novel spawned so many imitations that its name was used to define a genre, which is sometimes described simply as a "desert island story"[1] or a "castaway narrative".[2]
ロビンソナード (/ˌrɒbɪnsəˈneɪd/) は、主人公が突然文明から切り離され、通常は難破するか人里離れた無人島に置き去りにされ、手元にある限られた資源から生き残るための手段を即興で考えなければならないフィクションの文学ジャンルです。 このジャンルの名前は、ダニエル・デフォーによる 1719 年の小説『ロビンソン クルーソー』に由来しています。 この小説の成功により、非常に多くの模倣作品が生み出されたため、その名前はジャンルを定義するために使用され、単に「無人島の物語」[1] または「漂流者の物語」[2] と表現されることもあります。
ということは、探すなら18世紀か……
一応シェイクスピアの『テンペスト』も孤島が舞台になる物語だけど……
1611年頃
一応英wikipediaの"Uninhabited island"の"In literature and popular culture"の項にはもっと古い作品について言及がある
Uninhabited island - Wikipedia
The first known novels to be set on a desert island were Hayy ibn Yaqdhan written by Ibn Tufail (1105–1185), followed by Theologus Autodidactus written by Ibn al-Nafis (1213–1288). The protagonists in both (Hayy in Hayy ibn Yaqdhan and Kamil in Theologus Autodidactus) are feral children living in seclusion on a deserted island, until they eventually come in contact with castaways from the outside world who are stranded on the island. The story of Theologus Autodidactus, however, extends beyond the deserted island setting when the castaways take Kamil back to civilization with them.[8]
無人島を舞台にした最初の小説は、イブン・トゥファイル (1105-1185) が書いた『ハイイ・ブン・ヤクダン』で、次にイブン・アル・ナフィス (1213-1288) が書いた『テオログス・アウトディダクトゥス』が続いた。 両方の主人公(『ハイイ・ブン・ヤクダン』のヘイイと『テオログス・アウトディダクトゥス』のカミル)は、無人島で人里離れて暮らす野生の子供たちだが、最終的には島に取り残された外の世界からの漂流者たちと接触することになる。 しかし、テオログス・アウトディダクトゥスの物語は、漂流者たちがカミルを文明に連れ戻す無人島の設定を超えて広がります。 [8]
こういうmeme的というか、とりとめのない雑談のあるあるネタがいつから存在するかって探すの超大変だ
残念ながら"Desert Island Discs"の1942年以前ではっきりと「もし無人島にひとつだけ持ってくなら」のようなmemeの記述を発見できなかった
https://x.com/Circle_Halberd/status/1762628685679464845?s=20
……という嘘豆知識
正直フフッと笑ったが、それはそれとして本当の元ネタが気になるのじゃわしは
英wikipediaの"Uninhabited island"の以下の記述
The term "desert island" is also commonly used figuratively to refer to objects or behavior in conditions of social isolation and limited material means. Behavior on a desert island is a common thought experiment, for example, "desert island morality".[3]
「無人島」という用語は、社会的に孤立し、物質的手段が限られている状況での物体や行動を比喩的に指すのにもよく使われます。 無人島での行動は、たとえば「無人島の道徳」などの一般的な思考実験です。
これの出典がOEDになっている
ひょっとしたらOEDに私の欲しい情報があるかもしれないが、OEDをすぐさま読める環境にないな……
人々が「無人島にもし漂着したなら?」というIFを雑談ネタとして共有できるということは大航海時代以降……"Robinsonade"というジャンルが一般に認知されている環境……であるはず
へたすりゃギリシャ神話の時代までさかのぼることが出来るネタかもしれん
『オデュッセイア』とか……アルゴー船の冒険の話とか……船旅のエピソードがあるので、無人島に関するなんらかのミームの源流がそこにあっても驚かない
そうなったら手に負えん
---
改めてこれを参考に探し直すか……元気な時に
元祖や系譜、起源、お約束、新語などに関する「まとめのまとめ」&関連リンク 『初出・系譜ポータル』 - Togetter
---
19世紀後半〜20世紀前半ごろがこの問答が定番になった時期である、という可能性を探りましょうね
近代的なレジャーとしてのキャンプとか、ボーイスカウトとか……サバイバルスキルの知識が一般に広まったのがおそらくこの時期
その知識がないと無人島何持ってく問答は発展定着しにくいかもしれない
いやーでも聖書って回答が多いって話があるならサバイバルスキルの知識関係なさそうに見える……
→初期の定番問答は本を問う形式だった可能性もある、なんともいえん
サバイバルガイド的な本が19世紀に刊行されてないかを調べてみるか
---
"Desert Island Discs"の1942年以前で「もし無人島にひとつだけ持ってくなら」のようなmemeの記述を発見
無人島に本を一冊だけ持ってゆくとすれば: ケペル先生のブログ
このことを最初に明言した人はだれだろう。明治期にドイツ系ロシア人の哲学者で東大で教鞭をとり、学生の人気を集めたラファエル・フォン・ケーベル(画像1848-1923)らしい。彼は「ケーベル博士随筆集」のなかで「無人島に1年間流されるとしたら、自分が選んでもってゆく一冊は、まず聖書である」と述べている。かれは次に、「ファウスト」「ホメロス」「ドン・キホーテ」、ニーチェのもの、ベートーベンの楽譜などをもって行きたいと書いている。しかし有名なデフォーの「ロビンソン・クルーソー」(1719)のなかで絶海の孤島に流れついた主人公が「聖書」を読んで信仰の支えにしたことを書いている。
発言時期が不明だが、この方は1923没なので"Desert Island Discs"よりおそらく古い
『ケーベル博士随筆集』という本に記載があるらしいが……図書館に行かないと読めない類の本だな
しかしやはり『ロビンソン・クルーソー』が念頭にある発言か……
さて、さらにこれ以前に遡れるだろうか?
ケーベル博士がロシア出身で日本にやってきた人で、"Desert Island Discs"はイギリスのラジオ番組
20世紀初頭には世界中で認知されている定番ネタということじゃないか
本があるならいくらでも読むが、どの本を読めばいいかのあたりをつけるのが難しい
---
ゲーテが『私が獄につながれ、ただ一冊の本を持ち込むことを許されるとしたら、私は聖書を選ぶ。』という言葉を残しているらしい
この発言の出典元文書がちょっとすぐには見つけられていないのだが
偉人の名言は「実は言っていない」ってことが往々にしてあるから疑ってかかるスタイル
ゲーテの生没年は1749~1832
無人島に持ち込むものは何問答と直接の関係はないかもしれないが、一種のクローズド環境に何を持ち込む?という発想はこの時代からあったということ
Robinsonadeの流行で便利なクローズド環境として無人島が一般に認知された?
元々「閉鎖環境に一冊本を持ち込むなら」という発想が存在した(その一冊とはたいてい聖書、なんというか最初から聖書という答えありきの仮定に見える気がする) ↓ Robinsonadeの流行で閉鎖環境として無人島が定着した ↓ メディアの発展で本以外(レコードなど)も問われるようになった ↓ さらに時代が下り、持ち込めるものはジャンル無制限になった
みたいな流れという仮説を立てれそうだが……
まあまあ、結論を急ぐことはない
人間が画風を模倣するのはOKだが、AIが画風を模倣するのは量の違いからNGにしてほしいという意見がある。
正直自分は大して絵を描いていないので、心からの共感はできないが理解はできる(AIが描いたかどうかをどうやって証明するのか、画風が似てるかをどう判定するか、田中圭一のように人力で絵柄を模倣した人間の絵を許可を取って学習させたらどうなるかなど、考慮すべきケースが多すぎて実現ハードルが非常に高いとは思うが)。
人間と会話ができ、長期的な関係を築けるAIを想像してほしい。ドラえもんでもなんでもいいが、まあそういった作品を想像していただきたい。
そういったAIが、イラストに限らない汎用的な学習能力を持っており、かつ人間のそれを大きく超えていたとしよう。
もしそのAIが、「俺、この作家さんの絵が好きなんだよね。模倣してみよっかな」と言い出したら、僕はどう答えるだろうか。
彼が大切な親友だったとしても、「お前は量が違いすぎるからやめろ」と言い放てるだろうか。
なお、この思考実験に出てくるAIは「イラストに限らない」というのが重要だ。イラストに限るのなら「そんな機能搭載しなければよい」という話になるかもしれないが、家事等を手伝わせたいなら汎用的な学習能力が必要なはずで、結果的にイラストも描けてしまうかもしれない。
まあ、正直やり尽くされた思考実験かもしれない。
文化庁のAIと著作権についてのパブコメの結果が話題ですね。自分も2万件超のコメントの一つです。副業程度の収入を得ているアマチュア絵描きとして、生成AIには何らかの規制が必要であるという立場でコメントを送りました。
主要な問題としてコメントに書いたのが、生成AIの学習に海賊版(違法アップロードコンテンツ)が使われている問題です。
https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/hoseido/r05_07/pdf/94011401_01.pdf
文化庁PDFの30〜32ページに海賊版、つまり違法にアップロードされた書籍、写真、動画、絵などをAI学習に用いることについての意見が並んでいます。文化庁の見解としては、生成AI事業者が海賊版であると知ったうえでコンテンツを学習に用いた場合、事業者は権利侵害の責任を問われる可能性があるとの考え方のようです。
現行の生成AIは海賊版の学習なんてしているのか? 確実にしているようです。画像生成AIのひとつNovelAIが、海外の無断転載の温床であるDanbooruから学習していると公言したりとか、MetaがAI学習に使用したデータセットが膨大な海賊版書籍によるものだったとか、さまざまな話題があります。
もとより、ウェブには権利者に無断でアップされたもの(創作物だけでなく写真なども含む)が溢れかえっていることは周知の事実です。ウェブから効率よく膨大な学習データを求めれば、そうしたコンテンツが混ざってくることは当然なわけです。それを承知のうえで、生成AIの開発は行われている。
これはクリエイターや企業の著作権にとどまる問題ではありません。海外では、画像生成AIの学習データに児童ポルノや個人のプライバシーに関わる画像が含まれていることも指摘されています。自分の知らないところで自分の写った写真がウェブに放流されAIの学習対象になっている、ということもあるのです。
「たとえ海賊版や個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。
ですが仮に、ある漫画家が「海賊版サイトで漫画を読みまくって漫画を勉強しました」と発言したら、とうぶん仕事を失うでしょう。違法行為であるかは別として社会的、倫理的に許されない行為であることは明白だからです。
となれば、生成AIの学習に海賊版を用いることも同様に許されないでしょう(特に、AI肯定の立場から言われる「人間の学習とAIの学習は同じ」という見方ならば)。
クリエイターが、海賊版を学習したAIをそうと知って自身の創作に使うことは、間接的な海賊版の容認とも見なされるかもしれません。
非倫理的な学習方法によって成り立っているのが生成AIの現状です。批判的な立場からクリーンな学習データによるAIが求められるのはこのような理由もあるわけです。
残念なことに、生成AIを肯定・推進する立場の人々はこの学習データ問題に触れたがりません。自分の見てきた範囲ですが、本や記事やSNSで、ここに真摯に向き合っている人はいません。
「ディープフェイクや特定個人の模倣などの悪質なAIの使い方だけが問題だ」という主張をし、その範囲では厳しく批判をする人はいます。もちろん悪質な使い方は許されません。しかし、自身の使っている生成AIがその学習の成り立ちから非倫理的である可能性には触れません。認めると面倒なことになるのがわかっているからでしょう。
反発の声を都合よく切り取り、身勝手に新技術を忌避している反AIというくくりで片付け、本来の問題から目をそらしているのです。
生成AIの開発者も利用者も、まずこうした事実を認めて、横暴なやり方で莫大な学習データを確保し、その問題は無視して利便性のみで強引に生成AIを普及させているという現状に向きあうべきです。
学習データの無作為な広範さが、ディープフェイクなどの悪事を容易にし広めていることも認めないといけない。そこから改めて、あるべき生成AIのあり方を考えないといけません。
許可を得たクリーンな学習データのみを使用し、データの概要は開示すること、これが必要です。
AIの普及が避けられない、技術の進歩は止まらない、と言うのなら、その過程で誰かを踏みつけにしない努力も払うべきです。生成AIを批判する人の大半は、技術の発展に反対しているのではなくその過程の理不尽に反対しているのです。
もう分断を煽るのはやめませんか
現在混乱を招いている要因は、おそらく以下の二つ
AI利用に向けて改正されたとされる著作権法30条の4は AIならなんでも許されるというわけではない。以下のように条件がついている。
著作物は,次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には,その必要と認められる限度において,いずれの方法によるかを問わず,利用することができる。ただし,当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は,この限りでない。
この辺りの解釈について紛糾している様子。
同30条の 4 は平成30年当時、事業者や研究者によるAI利用を想定していた。現在では一般市民にAIが広く普及し状況が変わってきたことから、同条の適応範囲について再整理を図るという趣旨で公開されたのが「AIと著作権に関する考え方について(素案)」
そして素案に対するパブリックコメントを募集した、というのが現在の流れ。
たぶん、CLIPのこと。テキストと画像の翻訳を行う。犬の画像を見て「犬」と識別することができる。
ネット上のあらゆる画像とテキストを学習することで作られた。OpenAIによって公開。画像生成だけではなくいろんなところに使われている。
画像生成AIはテキストエンコーダ(CLIP)と画像生成器の組み合わせでできている。stable diffusion等は拡散モデルを使っている。
1. イラストを用意する
学習を繰り返しノイズを増やしていくと最後はただのノイズから画像を出力する 連想ゲーム絵師が誕生する。連想ゲーム絵師は連想しかできないので自分が描いたものが何かわからない。犬を描いてといっても車を描いてくる。なので CLIPが誘導したりダメ出ししたりする。
どこかのイラストサイトかデータベースを使っているはず。「著作権的に安全な〜」みたいな触れ込みのやつはどこかのデータベースを購入して使っているんだと思う。
Pixivの主張は別におかしくない。このあたりは「AIと著作権に関する考え方について(素案)p7」(エ)において解説されている。"robot.txt"への記述によりAI学習を行うクローラーのアクセスを制限しているにも関わらず、勝手に学習に使うことは「データベースの著作物の潜在的販路を阻害する行為」として著作権違反になる(Pixivが将来的に本当に販売するかどうかは置いておく)
追加学習(LoRA)のこと。
既存のモデルに数枚のイラストを追加学習させることで絵柄を模倣(ファインチューニング)する。
特定の絵師さんのイラストを勝手に使う者がいるようでトラブルになっている。
絵柄に著作権はない。学習の際に行われる複製が著作権侵害にあたるかどうかが争点になっている。
著作権法30条の4 より
この辺りは「AIと著作権に関する考え方について(素案)」及びパブコメの返答に現状の解釈が示されているので興味のある方はどうぞ。
(p6. 特定のクリエイターの著作物のみを用いてファインチューニングを行う場合〜を参照)
※ここははっきりとは断定していないので自分で読んだ方が良いと思う。
(私の読解:)
程度問題ぽい。よくある画風なら問題にならないけれどはっきりと特定絵師さんとわかる感じだとダメそうですね
(私の読解終わり)
別にプロフィールなんて「トイレから出たら手を洗ってください」でも「フォローする際には五体投地してください」でも好きに書いてよいだろう。
それが法律に記されているかどうかは関係ない。ただのお願いだ。
「AI学習禁止」と書くなと騒いでいる人は何を考えているのかよくわからん。
「AIと著作権に関する考え方について(素案)」にも再三出てくるがAI学習を技術的に回避することは禁止していない。30条の4は権利の制限であって、イラストを差し出せという強制ではない。
見ればわかりますが個人よりも一般企業による意見が多く、返答とあわせてとても読み応えのあるものです。
このファイルを読んで個人の頭の悪そうな意見だけ抜粋してくるのは非常に違和感があります。