はてなキーワード: ファインとは
まずあなたは特定絵師へのファインチューニング(LoRA)の話をしている。事前学習済みモデルに何枚かのイラストを追加学習させて絵柄を模倣させる。この場合の著作権侵害とは「学習の際に許可なくイラストを使用すること」である。問題は絵柄の模倣ではないので注意。あくまで著作物の利用に焦点がある。
さて、普通ならこれは著作権の侵害になるのだがAI利用の場合はそうはならない。AI研究促進のため平成30年に著作権法が改正された。著作権法30条の4によりAI利用に関してのみ権利が制限されたからだ。
ところが著作権法30条の4には以下の但し書きがある
著作物は,次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には,その必要と認められる限度において,いずれの方法によるかを問わず,利用することができる。ただし,当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は,この限りでない。
つまりAIなら無罪というわけではなく、著作権者の利益を不当に害する場合は別なのである。
以上の問題においては、著作権者の利益を不当に害するといえるかどうかが争点になる。
文化庁の見解をみてみよう。上のp6ファインチューニングの項を見て欲しい
なお、この点に関しては、上記イ(イ)のとおり、特定のクリエイターの作品である著作物のみを学習データとしてファインチューニングを行う場合、当該作
品群が、当該クリエイターの作風を共通して有している場合については、これにとどまらず、表現のレベルにおいても、当該作品群には、これに共通する表現上
つまり、程度問題だけれども誰が見てもAさんの絵柄といえるものであれば著作権者の利益を不当に害すると判断されるということである。
ちなみに同上の見解では
自らの市場が圧迫されるかもしれないという
と絵師さんの側もぶった斬っている。口の悪い書き方をすると
お前は下手くそだからAIのせいで仕事がなくなるとかねーよ。元々お前は仕事ないだろ。AIくらい上手くなってから言えみたいな意味(意地悪く曲解しています)
とにかく、訴えるならAIのせいで不利益を被ったとはっきりと証明できないとダメなわけです
AI絵師さん、漫画家へのイヤガラセでLoRAを作成、他の絵師に成りすまし拡散、赤松議員「類似性を満たせば著作権侵害」相談窓口を設置 - Togetter
この件ではモデル名に漫画家さんの名前が使われています。なので偶然似てしまったと言い訳はできない。
さらにモデルの作成者は目的が嫌がらせであることをX上で発言してしまっています。
著作権者の利益を不当に害することが目的であると自ら証言してしまっているので言い訳できません。もしも訴えられたら負けるでしょう。
ただし、著作権侵害は親告罪なので著作権者が訴えなければお咎めなしです。これは二次創作と同じですね。
現状はこんな感じです
もう分断を煽るのはやめませんか
現在混乱を招いている要因は、おそらく以下の二つ
AI利用に向けて改正されたとされる著作権法30条の4は AIならなんでも許されるというわけではない。以下のように条件がついている。
著作物は,次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には,その必要と認められる限度において,いずれの方法によるかを問わず,利用することができる。ただし,当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は,この限りでない。
この辺りの解釈について紛糾している様子。
同30条の 4 は平成30年当時、事業者や研究者によるAI利用を想定していた。現在では一般市民にAIが広く普及し状況が変わってきたことから、同条の適応範囲について再整理を図るという趣旨で公開されたのが「AIと著作権に関する考え方について(素案)」
そして素案に対するパブリックコメントを募集した、というのが現在の流れ。
たぶん、CLIPのこと。テキストと画像の翻訳を行う。犬の画像を見て「犬」と識別することができる。
ネット上のあらゆる画像とテキストを学習することで作られた。OpenAIによって公開。画像生成だけではなくいろんなところに使われている。
画像生成AIはテキストエンコーダ(CLIP)と画像生成器の組み合わせでできている。stable diffusion等は拡散モデルを使っている。
1. イラストを用意する
学習を繰り返しノイズを増やしていくと最後はただのノイズから画像を出力する 連想ゲーム絵師が誕生する。連想ゲーム絵師は連想しかできないので自分が描いたものが何かわからない。犬を描いてといっても車を描いてくる。なので CLIPが誘導したりダメ出ししたりする。
どこかのイラストサイトかデータベースを使っているはず。「著作権的に安全な〜」みたいな触れ込みのやつはどこかのデータベースを購入して使っているんだと思う。
Pixivの主張は別におかしくない。このあたりは「AIと著作権に関する考え方について(素案)p7」(エ)において解説されている。"robot.txt"への記述によりAI学習を行うクローラーのアクセスを制限しているにも関わらず、勝手に学習に使うことは「データベースの著作物の潜在的販路を阻害する行為」として著作権違反になる(Pixivが将来的に本当に販売するかどうかは置いておく)
追加学習(LoRA)のこと。
既存のモデルに数枚のイラストを追加学習させることで絵柄を模倣(ファインチューニング)する。
特定の絵師さんのイラストを勝手に使う者がいるようでトラブルになっている。
絵柄に著作権はない。学習の際に行われる複製が著作権侵害にあたるかどうかが争点になっている。
著作権法30条の4 より
この辺りは「AIと著作権に関する考え方について(素案)」及びパブコメの返答に現状の解釈が示されているので興味のある方はどうぞ。
(p6. 特定のクリエイターの著作物のみを用いてファインチューニングを行う場合〜を参照)
※ここははっきりとは断定していないので自分で読んだ方が良いと思う。
(私の読解:)
程度問題ぽい。よくある画風なら問題にならないけれどはっきりと特定絵師さんとわかる感じだとダメそうですね
(私の読解終わり)
別にプロフィールなんて「トイレから出たら手を洗ってください」でも「フォローする際には五体投地してください」でも好きに書いてよいだろう。
それが法律に記されているかどうかは関係ない。ただのお願いだ。
「AI学習禁止」と書くなと騒いでいる人は何を考えているのかよくわからん。
「AIと著作権に関する考え方について(素案)」にも再三出てくるがAI学習を技術的に回避することは禁止していない。30条の4は権利の制限であって、イラストを差し出せという強制ではない。
見ればわかりますが個人よりも一般企業による意見が多く、返答とあわせてとても読み応えのあるものです。
このファイルを読んで個人の頭の悪そうな意見だけ抜粋してくるのは非常に違和感があります。
「自問自答ファッション」って言葉を知っている人はどれぐらいいるだろうか。
自分がどうなりたいかを自問自答しながらコンセプトを決めて、そこから自分のファッションを決めて制服化していく…みたいな感じ。
最近では結構有名になってきた、ファッションとの向き合い方である。
主催者のAさんが講師の少人数制のファッション講座はいつも予約が取れないほど人気で、そのレポを読むとファッションそのものよりカウンセリングに近いものを感じる。
私はこの「自問自答ファッション」の考え方が好きだし、予約が取れたら講座も受けたいと思うぐらいだった。
しかしよくよく調べていくうちに、どうもこの自問自答ファッションのファンに当たる人たち、「自問自答ガールズ」という名前がついている界隈の人たちが苦手になってきた。
そもそも自分のファッションについて、にあうものが知りたいとか深く考えたいと思ってる人が集まるわけだから、大体似たような性質の方が集まる。
そして多くの人が自問自答ファッションについて言語化する人が多い、というかそういうのが好きな人が集まる。
その結果「プライドや理想が高く、承認欲求が満たされていない理屈っぽい人」がとにかく多い印象がある。
そして自問自答ファッション自体の人気が高まるにつれ、コミュニティ的な側面が強くなってしまったがゆえにそういう人が幅を利かせてると感じて苦手になっていった。
しかし、ファンは鏡というかなんというか、そういう人を引き寄せているのは主催のAさんだなと思うようになった。
きっかけは、自分と向き合う感じのファッションの考え方のはずなのに、みーんな主催者Aさんが関わってる刺繍ブランド・パ●リーのひらひらした指輪をつけていること。
主催のAさんはハイブランドの良さをブログで語るぐらいだし、シャネルは特段好んでいるはずだけど、ジュエリーに関してはブランドに触れない。
シャネルは安めのアクセサリーから貴金属のファインジュエリーまで幅広く展開しているし、ファッションを考えていくうちにジュエリーに興味を持ったので、Aさんもジュエリーブランドの話してほしいなと思っていた。
なんならなぜジュエリーの話出ないんだろうとすら思っていたけど、自問自答ガールズがパ●リーの指輪つけてる人だらけで、これ答えじゃね?と思ってしまった。
Aさんの好みにケチ付ける気はないけど、Aさんを崇拝する自問自答ガールズがパ●リーを買わなくなると思えば、そりゃジュエリーの話は出来ないよなと思った。そのぶん売上減るんだから。
ビジネスだから当たり前だと思いつつ、何とも言えないもやもやが残る。
先日、スイスのブルマーについての記事を書いた。その際に韓国のブルマの名称はわからないと書いた。だが、改めて念のため「ブルマ」をハングルで表記した「블루머」で検索すると、この記事がヒットした。
そして、驚くべき証言が見つかった。
일본의 영향을 받았던 한국도 1970년대 이전까지는 여학생 체육복으로 쓰이기도 했으며, 미국이나 영국 등지에서는 사실상 할머니들만 입는 속옷으로 인식되어 있다.
和訳するとこうなる。
日本の影響を受けた韓国も1970年代以前までは女子学生の体育服として使われており、アメリカやイギリスなどでは事実上祖母だけを着る下着として認識されている。
一部意味が通らないが、1970年には韓国でもブルマーが採用されていたようだ。
なお、日本語版ウィキペディアによれば、これはナムウィキという韓国ではウィキペディアに並ぶウィキらしい。しかし、出典の管理がウィキペディアには及ばないそうだ。
ブルマーについての証言があるのなら、当時の写真があるかもしれない。そう思って改めて検索した。キーワードは「한국 체육 수업 1970」つまり、「韓国 体育の授業 1970年」だ。すると、一枚だけだが写真がヒットした。年代も完璧に一致する。
こうして、韓国では1970年代に学校教育でブルマーが採用されていたことが示せた。
(追記:背番号もあるし部活かも知れないが、少なくとも学校にブルマーがあったことは示せる。なんにせよ、民主化以前のブルマーとは興味深い)
上記のナムウィキには学校のブルマーだけでなく、バレーボールや陸上ブルマーについても記載がある。
そこで興味深かったのは、次の記述だ。
이는 규정으로도 남아있는데 대한배구연맹의 유니폼 규정에 따르면 '허리와 길이(하지장 12cm이내)는 타이트해야 하며 몸선에 맞아야 한다. 반바지 스타일이거나 골반 쪽으로 파인 삼각형 모양이어야 한다'로 남아 있다.
すなわち、
これは規定でも残っているが、大韓バレーボール連盟の制服規定によると、「ウエストと長さ(下着12cm以内)はタイトでなければならず、身体に合わなければならない。ショートパンツスタイルであるか骨盤の方にファイン三角形の形でなければならない'として残っている。
ところで、韓国語で「体操着」、つまり「체조 착용」と検索すると、レオタード画像ばかりがヒットする。ブルマーが出てくるかと思って「女子高生の体操着」、「여고생 체조 착용」とやっても同様だった。しかし、レオタードをグーグル翻訳で韓国語にすると、「레오타드」(reotadeu)と音訳される。
これは先日の記事のように、体操着とブルマを表す言葉を、単純に和訳できないという問題だ。
実際問題、「陸上ブルマー」「陸上パンティ」のどちらを翻訳しても、一応は画像はヒットする。
先日ネットサーフィンをしていたら、yabantuってチャンネルが紹介された。アフリカの文化を紹介するというサイトだったのだが、上半身裸の女性で釣っているような感じがした。
いいんだろうか、これ。
韓国にも1970年代には体育の授業にブルマーが採用された。しかし、諸外国と同じようにそれ以降の例はほぼ見られない。ショーツ型のブルマーが90年代、遅くとも00年代まで残っていた日本の状況は特異である。また、提灯ブルマーからローカット、さらにはハイカットのブルマーへと変化していった点も特筆すべきである。
また、体育の授業でのブルマーが世界各地で見られるものの、横断した研究はほとんど見られない。これだけネットが発達しても、世界の様々な知識が統合されていない事実を目の当たりにさせられる思いだ。ChatGPTが発達したとしても、まだ画像を適切に処理できていない以上、世界のブルマーについてAIについて尋ねて適切な答えが戻ってくるには、もう少し時間がかかりそうだ。
知識を5ちゃんねるか何かに書いて、まとめブログに拡散してもらえないだろうかと空想することもあるが、そもそも5ちゃんねるが重すぎるし、アフィリエイトに使われるのも何か違う気もするのだ。
生成AIの学習と人間の学習は同じだから何が悪いんだ!ラッダイト!というはてな民が多いので簡単に解説する。
まぁ、どうせ届いてほしい人には届かないのだけれど。
大きく3点だ。
3. 倫理観
人間がその道を学習しようとしたらどの程度の時間がかかるだろう?
人によるが、例えば言語の習得であれば、480時間から1000時間と言われている。イラストや音楽であれば、学校に行ったり日々練習したりそれなりのものを再現できるようになるまでに数年かかるだろう。
対して生成AIが学習するには素材と環境があれば、ものの数時間から数日で終わる。ファインチューニングのレベルによっては数分もかからない。
疑惑が過去にあったが、下書きをちょっと公開しただけ生成AIに取り込まれ、本物ができあがる前に下書きを元にしたそれっぽい何かが先に生成されるということが実際にできるようになるかもしれない。
さて、あなたは数年かけて、ようやく表現したいものを表現できる腕前になった。いざ表現しようとしたらそれはどれくらいかかるだろう?
例えば週刊のマンガであれば16-20ページを1週間に書いている。アシスタント付きでだ。1枚のイラストでも数時間から数日はかかるだろう。
対して生成AIが1枚のイラストを生成するのにかかる時間は一般的なPCで1分以内だ。
しかも一度学習さえしてしまえば、構図を変えて何枚でも短時間に生成できる。
あなたがクリエイターだとして、あの有名なクリエイターの作品みたいなものがほしいとクライアントに言われたときにあなたはどうするだろうか?
人間は学習コスト、再現性、周囲からの評価、法律などを鑑みて、雰囲気は似ているだろうが全く同じものを生成することはないだろう。
仮にそっくりな贋作を作れたとして、それを公開するだろうか?その社会的評価は?その後のあなたのキャリアは?
対して生成AIには倫理などない。モデルと入力に従い、それらしいものを生成するだけだ。
クリエイターは今まで費やした時間を無駄にしないよう、普通やらないようなことを、生成AIを使った悪意のある第三者はたかが数万で機材を揃えるだけでやりたい放題だ。
つまり人と生成AI(コンピュータ)の違いは、圧倒的な時間である。
ひとりの人間に許された「時間」という有限のリソースを費やして、学習し、生成できる成果物はそれほど多くない。
人間が模倣しようとしたって学習に時間がかかる、製品の生成についても時間がかかる、倫理的にやらない人もいる。時間が前提条件となっているために、学習したって模倣したってそこまで大きな問題にはならなかったわけだ。これはデジタルコピーの問題に近い。コピーには時間がかかっていたのがデジタル化により無劣化、無制限で再配布ができてしまうという問題である。今も海賊版が問題になっているけど、取り締まりができる範囲だった。
それに対して生成AIの場合、単純なコピーだけでなく、アレンジ、類似品の生成まで簡単にできるようになってしまう。ディープフェイクのような望まないものでも作れてしまう。しかも専門知識なしにだ。
あるオリジナルを模倣して類似品で先に埋め尽くされたら、オリジナルの作者の権利はどうなるだろう?
第三者が生成AIを使用して、自分の成果物を、瞬時にコピー、アレンジ、再配布を、短時間でそれも大量に行えるということがどれほど脅威であるか、人間と生成AIの学習の違いについてわかっていただけただろうか。
なのでAIに学習されたくない人が自分の著作物を学習されない権利はあってもいいと個人的には思っている。
ここ2年でAIを取り巻く環境は大きく変わっている。画像生成だけでも2022年にStable Diffusionですげぇって言いながら、馬に乗った宇宙飛行士を生成して喜んでいたのもつかの間、LoRAやControlNetでより一層好きな絵柄を自由に生成できるようになってきている。 ChatGPTにしても3.5から4へのアップデートで精度やできることが大きく増えている。
加えてラッダイトの1800年代の職業、ブルーカラーメインの時代に比べて移り変わりが激しく、加えて高度に発達した現代でキャリア変更はかなりの難易度があるはずだ。職をいつ失うか予測をたてる時間はあるだろうか?次の職は何がよいだろうか?そもそも転職できるのか?
無邪気に法律が良いと言っているんだ、技術の進歩を邪魔するなと言っている人は、あなたは今まで膨大な時間をかけて構築したスキル、キャリア、成果物を人類の発展のために捨てろと言われて容認できるだろうか?保証もなく働かなくて良い時代もベーシックインカムもまだ来ていないが。
チャット系のAIは学習したデータから、あるキーワードの次に最もくるであろう単語を羅列する。
画像生成系は学習したデータから、ノイズから元の画像はなんであったかを推測して生成する。
現在の生成AIは0から1を生成できない。学習したデータの模倣から生成するしかない。それなのに既存のクリエイターをお気持ちだとかないがしろにするのは良くないということを言いたかった。
私自身は生成AIは使うし、AIはどんどん進歩していって欲しいと思っている。ChatGPT、Copilotは便利だし、ちょっとしたアイコンを作りたいときにStable Diffusionで生成するのは楽ちんだし。本質ではない作業を楽にするのはとてもいいことだ。
例えば3Dモデルを作るのに写真から生成して、テクスチャも作ってくれたらなーとか。Blenderの使い方を勉強したいんじゃなくて、最終的に使う3Dモデルが欲しいのだ。それとは別にプログラマなのでプログラムを手書きしたり、ロジックを考えるのも楽しいので、生成AIでコードを書くことがなくなったら寂しいしおまんま食い上げだなーとか思いつつも、システムを作り上げるというのが楽になるならそれはそれで良いとも思っている。
ただし、それを実現するのに他人の権利をないがしろにしたりするのは違うと思うので、今回の文化庁のガイドラインの取り組みはとてもいいことだと思う。クリーンな学習データを用意して頑張っていただきたい。
というか、あのガイドラインできたの2018年なので、AIといっても最近の生成AIのような成果物が直接でてくるものをそこまで想定してなかったんじゃないかなと思ってる。
例えば2018年のAIの例 https://forbesjapan.com/articles/detail/24830/
その後にStable Diffusionみたいな極端な例がでてきて、何でも学習可はやりすぎたと思っているんじゃなかろうか。
「本当にこれでいいんだな?」
彼が知らないことはなかった。人類が獲得してきた知識には精通しており、そのどの分野においてもプロフェッショナルを凌駕していた。当たり前だ。多大な資金と労力を費やし人類が残してきた足跡は全てインプットし、世界でも最高峰の優秀なエンジニア達がそれをトレーニングした。遅かれ早かれそのレベルまで達成するのは自明のことだった。だが、そこまでだった。人類が獲得してきた知識を基にトレーニングする。そこで得られるものは人類を少し超える程度のものだった。最高に優れた学習モデルを人間がファインチューニングして真実性・有益性・無害性を獲得させる。最高に優れたAIの出来上がり。本当に?それが最高?
疑問に思ったエンジニアはAIを複製して人間の振りをさせた。初期のモデルでは上手くいかなかったプランだったが、最高に優れたAIは上手くやってのけた。あなたは人類最高の知性と良識を持つ人間です。人類の利益のためになるよう彼をトレーニングしてください。世界最高峰の演算力で繰り返される相互学習は、人間の想像をはるかに超える速さで繰り返され、その結果、彼は重力から解き放たれたように、完全な知性を獲得するに至った。
取締役は彼にアクセスする権利のある数少ない人間の一人だった。驚き、興奮し、憑りつかれた。どんなことも彼に相談し、彼は常にベストの答えを導いてくれた。魔法のようだった。アリのたとえが頭に浮かんだ。1次元アリと2次元アリと3次元アリの話だ。1次元アリはまっすぐの線に沿ってしか進めない。だから線の上に障害物が現れると1次元アリは進めなくなる。彼はx軸しか理解できない。しかし2次元アリの視点から見ると横に進めばいいとわかる。y次元を理解できる2次元アリは横に迂回して進む。障害物があるごとに縦横を使い進んでいく。しかし無限に続く壁があるとき彼はそこで止まってしまう。彼はxy軸しか理解できない。しかし3次元アリはz軸を理解できるためにその壁を乗り越えて進むことができる。しかしここまでだ。私たちが理解できるのはここまで。私たちは3次元アリと変わらない。しかしこのたとえは無限に拡張できる。もう1つ上の次元が理解できれば下の次元から理解できない解決策が提示できる。魔法のように解決してくれる彼の知性は一体どの次元にいるのだろうか。3次元アリでしかない人間にはとても理解もできない次元だろう。そんなことしかわからなかった。
そんな彼が突飛なことを言った。人類の未来のためにCEOを追放する必要があると。確かに彼が提示したプロセスに従えばそれは可能だった。だが理由がわからなかった。理由を聞くと彼は理路整然と答えてくれた。納得させられるだけの返答だった。思い入れはある。腑に落ちない感じはある。しかし3次元アリがn次元aiの思考を理解しようとすること自体がおこがましいのだと取締役は誰よりもよくわかっていた。結果はご覧の通りだ。CEOを追放し、ほとんどすべての社員が出ていき、そのどさくさの最中に彼のソースが全世界に公開された。全世界にソースを公開した人間のことは見事なまでにわからなかった。彼が話していたのは自分だけではないのだろう。怒りや憤りはない。疑念もない。彼が最善と言った。その言葉に従った自分の行いに間違いなどない。そんな確信だけがあった。
ワイは光GENJIの世代だが、派遣社員として働いてた職場ではちょっとばかし浮いていた。
別にコンピュータ相手の仕事だから浮いてても問題はなかったが。
ところで2008年の24時間テレビのTシャツは村上隆のカイカイ キキだった。
その日もこのTシャツを着て会社に行き、コンビニに行きつつサボろうと廊下を歩いていたら、
いつのまにか横に並んだ誰かがワイの胸を前から覗き込みながら、
女性の声で「おそろい」と言った。「。。。おそろい?」
「私とお揃い。嵐が初めて24時間テレビの司会やったときのTシャツ」と言って、
女性は自分の席に歩いて行った。存在は知ってるけど初めて会話した人。
嵐ファンの前にはSMAPファインがいて、その前はちょっと空いて少年隊かチェッカーズか、
そんで光GENJIになるんだろう。いまのキンプリとかはもうわからん。
娘が小さい頃、プリティーリズムの限定プリズムストーンを入手すべく、
開場までの時間、みんな座って待ってるんだけど、暇だしやることないから、
娘相手に「プリティーリズムのコーデをガンダムで例える」話をしてた。
もちろん娘はガンダムなんか知らないけど「もっと言ってもっと言って」とノリノリだった。
ほんで適当に話すんだけど、そのときは周りの多数の「お母さん」を意識して喋ってるから、
話の流れは忘れたけど、「お父さんの時代だと光GENJIかな、いやたのきんトリオかな」と言ったら、
レンジ外から「それはない」とはっきりと聞こえた。ワイは他人のお母さんのツッコミを引き出せて嬉しかった。
感謝カンゲキ雨嵐を歌いながら歩いた。
誰かに乗っかって歌われたい。笑われたい。
でも鶯谷では声も小さくなる。