はてなキーワード: 機械学習とは
未だに「謎の半導体メーカー」程度の認識の方になぜNVIDIAが時価総額世界4位なのかをあれこれ説明する必要があるので短めにメモ。半導体業界のすみっこの人間なので機械学習まわりの説明は適当です
・~1993年 AI冬の時代。エージェントシステムがさほど成果を挙げられなかったり。まだ半導体やメモリの性能は現代とくらべてはるかに劣り、現代のような大規模データを用いた統計的処理など考えられなかった。2006年のディープラーニングの発明まで実質的な停滞は続く。
・1995年 NVIDIAが最初のグラフィックアクセラレータ製品NV1を発売。
・1999年 NVIDIAがGeForce 256発売。GPUという名が初めて使われる。以降、NVIDIAはGPU業界1位の座を守り続ける。
・2006年 GPGPU向け開発基盤CUDAを発表。以降、その並列計算に特化した性能を大規模コンピューティングに活用しようという動きが続く。
・2006年 ディープラーニングの発明。のちのビッグデータブームに乗り、これまでよりはるかに高性能なAIを模索する動きが始まる(第3次AIブームのおこり)
・2006年 CPU業界2位のAMDがGPU業界2位のATIを買収、チップセットにGPUを統合することで事実上自社製品をNVIDIAと切り離す戦略に出る。CPU業界1位のインテルも、同じく自社CPUに自社製GPUを統合する動きを強める。NVIDIAはこれまでの主力だったGPUチップセット製品の販売を終了し、データセンター向けGPGPUのTeslaシリーズ、ゲーム用外付けGPUのGeForceシリーズ、ARM系CPUと自社GPUを統合したTegraシリーズの3製品に整理する。このうちTeslaシリーズが性能向上やマイクロアーキテクチャ変更を経て現代のAIサーバ製品に直接つながる。GeForceシリーズはゲーマー向け需要や暗号通貨マイニング向け需要も取り込み成長。Tegraシリーズは後継品がNintendoSwitchに採用される。
・2012年 ディープラーニングが画像認識コンテストで圧倒的な成績を収め、実質的な第3次AIブームが始まる。
・2017年 Transformerモデル発表。これまでのNN・DLと異なり並列化で性能を上げるのが容易=デカい計算機を使えばAIの性能が上がる時代に突入。
・2018年 IBMがNVIDIAと開発した「Summit」がスパコン世界ランキング1位の座を5年ぶりに中国から奪還。全計算のうち96%がGPUによって処理され、HPC(ハイパフォーマンスコンピューティング)におけるGPUの地位は決定的になる。NVIDIAの開発したCPU-GPU間の高速リンク「NVLink」が大規模に活用される。「Summit」は2020年に「富岳」にトップを奪われるまで1位を維持。
・2018~2021年 BERTやXLNet、GPT2など大規模言語モデルの幕開け。まだ研究者が使うレベル。
・2019年 NVIDIA CEOジェスン・ファン(革ジャンおぢ)が「ムーアの法則は終わった」と見解を表明。半導体のシングルスレッド性能の向上は限界に達し、チップレットを始めとした並列化・集積化アーキテクチャ勝負の時代に入る。
・2022年 NVIDIAがH100発表。Transformerモデルの学習・推論機能を大幅に強化したサーバ向けGPUで、もはや単体でもスパコンと呼べる性能を発揮する。H100はコアチップGH100をTSMC N4プロセスで製造、SK Hynix製HBMとともにTSMC CoWoSパッケージング技術で集積したパッケージ。※N4プロセスは最新のiPhone向けSoCで採用されたN3プロセスの1つ前の世代だが、サーバ/デスクトップ製品向けプロセスとモバイル製品向けプロセスはクロックや電流量が異なり、HPC向けはN4が最新と言ってよい。
・2022年 画像生成AIブーム。DALL-E2、Midjourney、Stable Diffusionなどが相次いで発表。
・2022年 ChatGPT発表。アクティブユーザ1億人達成に2カ月は史上最速。
・2023年 ChatGPT有料版公開。Microsoft Copilot、Google Bard(Gemini)など商用化への動きが相次ぐ。各企業がNVIDIA H100の大量調達に動く。
・2024年 NVIDIAが時価総額世界4位に到達。半導体メーカー売上ランキング世界1位達成(予定)。
こうして見るとNVIDIAにとっての転換点は「ディープラーニングの発明」「GPGPU向けプログラミング環境CUDAの発表」「チップセットの販売からコンピューティングユニットの販売に転換」という3つが同時に起こった2006年であると言えそう。以降、NVIDIAはゲーマー向け製品やモバイル向け製品を販売する裏で、CUDAによってGPGPUの独占を続け、仮装通貨マイニングやスパコンでの活躍と言ったホップステップを経て今回の大きな飛躍を成し遂げた、と綺麗にまとめられるだろう。
いや知ってる知らない以前に機械学習とか全くこの話題に関係ないからね
ある時点で日本国籍を持つ人間全員に試験をして偏差値を測定する
すると「偏差値60未満であるために日本国籍を剥奪された人と、日本人」という集団において「日本人全員が偏差値60以上」という状況が成立する
それだけの話
機械学習とか言い出してる時点で「いい加減」なのよ
たぶんそういう部分がメインになると思うんだよね
次にくるのがノーコード・ローコード・RPAの分野、ここが活発になる
そんで5年10年してやっとソフトウェアロボットが普及し始める
産業革命ほどの変化はないとは思うけど、やらなきゃ時代について行けないみたいな存在になるんじゃないかな
スマホ登場の変化よりも少ないと思う
それはそれとして、小学館への「もっと作家に寄り添え」の大合唱については、小学館もしんどいだろうな…とも思う。
この辺の感想の内訳を、出版業界の端っこ(非漫画系)から自分の知識に基づいて書く。
今回の原作と脚本の問題は、つきつめれば著作者人格権の問題だと考えている。
(仕事上、著作権について多少は調べているが、法律の専門家ではないことは先に付言する)
「財産権」とは、そのまま、著作者の財産的利益を守る法律である。
そして、今回でいうドラマにあたる「二次的著作物」を作る(翻案)/利用することなどは
すべて著作権者の権利であり、第三者が行う場合は許諾が必要だ。
対して「人格権」とは、著作者の「精神的利益」を守る法律である。
公表権・氏名表示権・同一性保持権、つまり著作物を公表するかどうか、名前を出すかどうか、作品の改変を容認するかどうか。
このふたつの違いは何かというと、
「財産権」は譲渡も相続もできる(著作者でなくても、著作権者にはなりえる)が、
「人格権」は、だれにも譲渡も相続もできない、「著作者本人のみ」にある権利だということだ。
個人的に「精神的利益」とは、ネットスラングで言う「お気持ち」と同義であると考える。
軽んじる意味で言うのではない。
公表するか、名前を出すか、改変してもいいかどうか。つまり、自分の著作物が、自分の納得のいく形で扱われているかどうか。
それによって守られる作者の「気持ち」こそが、法律で守る価値のある、大切な「精神的利益」なのだと思っている。
以上を踏まえて今回の件を見ると、
今回、原作者がドラマ側に繰り返し要望したのは、自身の著作者人格権の尊重だと考える。
もちろんそれ以外にも、著作者には二次的著作物の作成/利用の許諾を行う権利があるのだが、
「ドラマの結末を自分に決めさせてほしい」「キャラクターを変えないでほしい」という要望は、作品世界そのものを守りたい、言い換えれば「同一性保持権」を守りたいという願いのもとに出されたように、私には思える。
そして前述の通り、それは著作者本人の「精神的利益」を守る重要な権利だ。
ここまで書いた通り、著作者人格権とは作者の精神的利益を守る大切な法律だ。
よくわかる。
今回のように著作者一人で本が一冊出来るような漫画や単行本であれば、先生の納得を大切に
進めましょう、といえるだろう。
けれど、たとえば、子供向けの学習ドリルをつくることを想像してほしい。
問題文、解答解説文、ページ内のイラスト、すべて著作物であり、それぞれ著作者がいる。
なので、理屈上は、ドリルのカットイラストを描いたイラストレーターさんが、あるひとつのイラストを指して「このイラストをもう公開したくない」といえばそれは尊重されるべき、となる。
著作財産権ならばお金で解決…つまりイラスト自体の権利を買い取るという交渉もできるが、著作者人格権は譲渡できない。著作者がダメと言ったらダメである。
公表したくない…それは、どこまでの話なのか。もう印刷して積んである在庫は、書店に出回っている在庫は。シール対応か? 断裁か? 絶版か?
もちろん、そんなことになった例を私は知らないし、たいていのクリエーターさんはこちらの状況を汲んで、たとえば改訂するときに外してください、などの常識的な要望におさめてくれる。
ところで出版系は契約がルーズだなんて言われるが、最近は結構まじめにやっている(少なくとも私の周りは)。
さて契約書を結ぼうとなると、この著作者人格権については悩ましいところがある。
何せ字義どおりに捉えたら強力すぎる。
著作者人格権を盾に、出版物全体に影響を及ぼすような運用ができるのか、それは判例が出ない限りわからない。わからない以上、我々は会社員なので、裁判沙汰になる芽はできるだけ摘まなければならない。
かくして契約書に、「著作者人格権を行使しない」なんて文言を盛り込む羽目になる。
「著作者人格権の不行使」は契約書では案外よく見る言葉である。
たとえば会社のポスターやパンフレットやDMを発注したとして、取引先の「公表権」で取り下げさせられたり、「同一性保持権」で修正できなかったりする可能性がある…となると、必要性が想像つく人もいるのではないか。
クリエイターが本来持つ権利を制限する契約は、誠意に欠けると思っている。
今回の事件は漫画作品なので、カットイラスト1つとはわけが違う…とも思うが、
わけが違うか? ほんとうに? すべての著作物は同等に尊重されるべきでは??
という思いもある。
100%くもりなく「著作者人格権を尊重します!」と言い切れるかというと…権利の強さゆえに、あまり現実的でない、と思ってしまう。
今回の問題の根幹が「著作者人格権の尊重」をめぐるものだと考えると、小学館全体として声明を出すのは苦しいだろうな…と想像している。
逆に言えば、それ以外の事情……芦原先生が小学館に対して寄せていた信頼が裏切られてい
た、というような経緯がないことを祈っている。
---------
ちまちま書いていたら小学館から著作者人格権に言及した声明が出ていた。
----------
言葉だけが先走りそうで、そして実際権利としてはかなり強いものなのでちょっと先が思いやられる。
なお「じゃあAI学習は著作者人格権侵害なのでは!?」と盛り上がってる人を見たが、機械学習は私的利用とかと同じ例外規定やで。
人はなぜワクチン反対派になるのか ―コロナ禍におけるワクチンツイートの分析―
https://www.t.u-tokyo.ac.jp/press/pr2024-02-05-001
〈研究の内容〉
本研究はまず、2021年1月から12月までに収集された「ワクチン」を含む約1億件のツイートを収集し、機械学習を用いて「ワクチン賛成ツイート」「ワクチン政策批判ツイート」「ワクチン反対ツイート」の3クラスタを抽出した。次に、「ワクチン反対ツイート」を多くつぶやいたりリツイートしているアカウントを特定し、「ワクチン反対ツイート拡散アカウント」として定義した。そして、「ワクチン反対ツイート拡散アカウント」を多くフォローしているユーザを「ワクチン反対派」として定義した。
上記プレスリリースの中で「賛成」というワードは4回しか使われておらず、そのいずれにも「賛成派」の定義を示す文というものは存在しない。
幸いにも元論文がPublicで公開されているため、主にMethod項を見てまとめていきたい。
1. 「ワクチン」「vaccine」を含む日本語ツイート98,805,971個を取得する。
3. ツイートのクラスタリングを行い、20種のクラスターが作成される。
4. 上位3つ(検証ツイートの99%・リツイートの98%を占める)のクラスター(「ワクチン賛成ツイート;pro-vaccine tweets」「ワクチン政策批判ツイート;opposition to the government’s vaccine policy」「ワクチン反対ツイート;anti-vaccine tweets」)を検討する。
5. 上記3クラスターのツイートを行ったアカウントとRTしたアカウントを集計する(「ワクチン賛成ツイート拡散アカウント:1,382,065」「政府批判拡散アカウント:248,699」「ワクチン反対ツイート拡散アカウント:196,936」)。
6. 上記3種のアカウントからそれぞれ50,000アカウントずつ無作為に抽出し、フォロー中のワクチン反対ツイート拡散アカウントの割合を算出する。
7. "ワクチン反対ツイート拡散アカウント/総フォローアカウント"の割合でソートし、上位25%(全体の12.3%以上)を"High anti-vaccine group"、下位25%(全体の0.24%未満)を"Low anti-vaccine group"とする。
ということで増田冒頭の「フォローアカウントのうち、ワクチン反対ツイートをした/RTしたアカウントの割合が少ないアカウント」ということになる。
これを「賛成派」という言葉で表現するのは実態を表しているようにはみえない。
しかし、元論文においてはこのような表現がほぼされていないといっていい。
基本的に日本語プレスリリースにおける「反対派」「賛成派」は上記メソッドで出たHigh group/Low groupとして表現されている。「反ワクチン性が高いグループ」「反ワクチン性が低いグループ」といったところ。
ただ、「ワクチン反対派」に類するフレーズは度々使われている(元からしてHigh/Low anti-vaccine groupだし)。
一方のLow groupでは、anti-vaccineに対してpro-vaccineという表現が使われている。が、ほぼ全ての用法で発言・ツイートに対してのみ使われており人に対して使われるケースは殆どない(イントロダクションに一回だけある)。
論文では誤解がないような表現にしているにも関わらずプレスリリースで「賛成派」という適切にはみえない表現を使うのはミスリーディングと言われても仕方ないのではないかと感じる。
Toriumi, F., Sakaki, T., Kobayashi, T. et al. Anti-vaccine rabbit hole leads to political representation: the case of Twitter in Japan. J Comput Soc Sc (2024). https://doi.org/10.1007/s42001-023-00241-8
"24/1/28 「生成AIの『学習』は学術用語だ」ということをそろそろちゃんと説明した方がいい"
https://saize-lw.hatenablog.com/entry/2024/01/28/210053
いまだにこのレベルの内容がバズってるのを見ると少し辟易させられるが
考えてみると、ちゃんと技術を理解してる人間すらこのレベルのことしか書けないのは
対話の場がなくお互いの言葉尻をとらえてる状況が悪いと思うので少し整理して書こうと思う。
・著作権をめぐる法理が日々変化しつつあることが理解されていない
という二重の難しさにある。
単に概念的に難しいというだけではなく、日本においては法制度の実装レベルですでに混乱が生じている。
とくに生成AIと著作権を語るにあたっては「フェアユースという発想に賛同するか否か」という観点が必要不可欠なのだが
一足飛びに機械学習だけ著作権法30条の4によってフェアユース的発想が導入されているという
非常に奇妙な状況になっている。
フェアユースとは何か、というのは非常に難しい。
「一定程度の公正さがあれば具体的な類型を列挙しなくても著作権を制限できるという考え」
とでも要約できるが、これだけでは意味不明だろう。
英国にフェアディーリングというものがあるが、こっちの「公正さ」はわかりやすい。
「非営利かつ研究や教育目的、批評、報道などの場合は著作権は制限される」ということ。
たとえばこれがなければ公営の学校や図書館は莫大な支払いに追われ成立しえない以上
「公正さ」のために著作権を制限してよいという発想はわかりやすく
近代以降の文明国でこれを否定するような法理はまず存在しえないだろう。
フェアディーリングそのものではないが、EUの情報社会指令第5条なども同じように
「公正さは基本的に非営利や少なくとも公益目的、かつ具体的にあらかじめ列挙される」という発想である。
「営利でも、今までに判例がなくても、抽象的な議論で公正さを主張できれば新しく著作権を制限できるケースを創れる」
ただし、元の著作権者の利益を「不当に」害さない範囲で。何が不当か?それはよくわからんので最高裁まで争いましょう。
一見すると無茶にも思えるが、現代人の多くはこの法理の恩恵を受け、著作権を制限することで利益を得る側だ。
フェアディーリングの発想だけでは、検索エンジンのサジェスト機能すら著作権的にアウトということになる。
それを「フェア」にしたのは、米国著作権法に組み込まれたフェアユースの発想なのだ。
サジェスト機能だけでなく、情報技術を用いた新サービスが興るたびに多くの裁判が発生している。
ただし問題点は、それがフェアユースだと認められたとしても、EUの法理で「いや、この機能は著作権的にアウトだ、金払え」ということも現時点ですら可能であるということだ。というか実際にそういう判決はそれなりの頻度で発生している。
だってフェアユースはあくまで米国を含む一部の国でしか確立していないのだから。
しかし、現実問題として、それなりに有用なwebサービスを立ち上げようと思えば、まずフェアユース的発想に頼らざるを得ないだろう。
そこでいわれている「引用」は基本的に紙媒体で実名の人物が著作で相互引用する低速で静的な状況を想定しており
インターネットでアルゴリズムやボットを含む様々なエージェントが高速で動的に情報をやり取りする状況は考慮外だ。
もちろん、法の運用上はそれらに解釈を加え、少しずつ判例を積み重ね、法的に許される状態を少しずつ拡張していくわけだが
その結果が「サジェストは権利侵害です」となるのと、「フェアユースなので許可」となるのとでは、新サービス市場の発展速度が圧倒的に違う。
これらは基本的に著作権侵害であるが、訴訟を起こす利益などが小さすぎるため放置されているに過ぎない。
しかし例えば、訴訟が大幅に簡素化・自動化され、二次創作やミームが不可能となる社会を人々は望むだろうか?
究極的には、「どちらを選びたいか」という話になってくる。
もちろん、自分でどちらかを選びたいからと言って、それが自分の国の法理として実装できるかというと、大抵はそれは別問題だ。
フェアユースの発想を頑として認めない米国民がいたとして、如何なロビー活動の天才でも、死ぬまでに合衆国法典第17編第107条を改正するにこぎつけるのはまず不可能だろう。
逆に欧州の新進気鋭の政治家がEUの現状を憂い情報社会指令第5条を全面撤廃・改正してフェアユース的発想を導入できるだろうか?
全政治生命を賭したとしても、やはり死ぬまでにやり遂げるのは無理だろう。
すでに著作権法30条の4が存在しているというのがそれを端的に示している。
しかもそれほど政治的な紛争もなくぬるっと成立した、としか言いようがない成立過程である。
これは「元の著作物に表現された思想又は感情の享受」以外なら、営利目的でも無許可で機械学習を行っていいとするものだ。
ただしここにはやはり「フェアさ」は必要で、その条件は「元の著作権者の利益を不当に害さない」という抽象的なものだ。
現時点では確固たる判例はないので、大型の訴訟が起きてから決まることになるのだろう。
前述したとおり、日本の著作権法にはもともとフェアユースの発想はない。
それにもかかわらずいきなりこれがぬるっと成立するというのは、ある意味特殊な日本の政治状況、法体系の面白さというほかない。
ぬるっと成立した以上、ぬるっと撤廃されることだってありうるのだ。
ともかく、日本においてはいろいろロビー活動の余地、法改正の可能性、政治闘争で結果が変わる余地が多分に残されている。
だが以下は整理しておくべきだろう。
・フェアユース的発想を認めたとして、生成AIの利用はどのような具体的なケースでどうフェア・アンフェアなのか?
これは非常に難しい問いだと思う。私が答えるなら
(1)
フェアユースは認める。そもそもインターネット時代にそれ以前の著作権法を解釈と判例でそのまま運用する発想は無茶。
二次著作物の利用や検索エンジンなどのwebサービスを「基本はアウトだが、訴訟コストが支払えないから事実上セーフ」という現状はいびつすぎるのはもちろんのこと、訴訟コストが簡素化されてそれらが制限される状況が公正とも思えない。
(2)
生成AIにおいて元著作物と生成物の市場での利用形態が完全に競合する場合はフェアユースを認めたとしても「不公正」といえる。そもそもフェアユースはあくまで「新しい市場の開拓」という米国的な大義名分があって初めて成立する。
イラストを売っている販売元と同じようなプラットフォームで再販売するような場合は市場拡大していないし不公正だろう。
逆にそうではないケース、元データの市場と新データの市場がバッティングしない場合にはフェアユース的発想で公正とされると思う。
というあたりになるだろうか。
あとで調べるためのコメント
☆これのことか?
AIの発展を邪魔するAIは犯罪と政府が認定! 『TIME』誌が選ぶ最優秀発明Glaze Nightshade
https://togetter.com/li/2275902
↓
第4回AI時代の知的財産権検討会の資料が公開。我々が送った意見は「資料5」にまとまっている。自分の意見がちゃんと載っているかご確認を。……まあ載っていたとしても結局会議内容に反映されてないっぽいのが最悪なんだが。30条4に対して未だにコレだよ
https://twitter.com/numatakeja/status/1734490907410571461
↓
https://www.kantei.go.jp/jp/singi/titeki2/ai_kentoukai/gijisidai/dai4/index.html
https://www.kantei.go.jp/jp/singi/titeki2/ai_kentoukai/gijisidai/dai4/siryou4.pdf (P.18)
☆現状の記述。下線が引かれていないので要検討項目とは見なされていない
「木目百ニ」の事件
AIイラストに規制を求める団体の理事「木目百二」氏が二次創作のガイドライン違反で支援サイトの作品全消し、謝罪に追い込まれる
https://togetter.com/li/2135111
会の理事である木目百二氏が成人向け二次創作で収益を得ていることが発覚
https://twitter.com/mokumemomoji/status/1651958062482337792 (☆2024/1/27現在アカウントが凍結されているため見ることができない)
ブルアカ公式が定めてる「継続的な創作活動のための、原材料費や光熱費諸経費、ツール類など制作にかかった費用程度の対価・利益を得る」を明らかに超過した売り方をして、
https://bluearchive.jp/fankit/guidelines
★二次創作を行う者について★
個人または法人格のない団体は、後述するような当社が定義する「非営利目的」の場合に限り、「ブルーアーカイブ」を題材とした二次創作物(同人誌・同人グッズ・デジタル作品など…)の制作・配布・頒布を自由に行っていただいて問題ありません。
個人または法人格のない団体は、非営利目的かつ日本国内での発表・流通の場合に限り、自由に二次創作物を制作していただいて問題ありません。
また、趣味の範囲で利用し、継続的な創作活動のための、原材料費や光熱費諸経費、ツール類など制作にかかった費用程度の対価・利益を得る場合においても非営利目的の範囲内とします。
散々著作権を軽視して無法地帯になったイラスト界隈を自分たちが作ったのに、なに「思想家」ぶって人に説教してるわけ?
端的に言えば「一般人を見下した態度を取るべきではなかった」これに尽きる
一般人に頭を下げずに、偉そうに「倫理」だの「道徳」だの「著作権」だの適当なことを吹聴してAIイラストへの攻撃を支持した
まさか政府が「GalzeやNightShade で機械学習の邪魔する人は、刑事告訴されちゃうかもね。ウフフフフ」なんて気色悪い文章を出すとは思ってなかったはずだ
そんなん言ってたっけ?どれのこと?
政府が「GalzeやNightShade で機械学習の邪魔する人は、刑事告訴されちゃうかもね。ウフフフフ」なんて気色悪い文章を出す
これ何のこと?
ググっても情報でないんだけど
俺は所謂反AI思想だ、ラッダイト的と批判されても「そうだ」と言い返す。それぐらいに反AIだ
だがSNSやらnoteでワイワイ反AI論じてる奴らに頭に来てる、はっきり言って害悪だ
具体的には「自分のことを倫理的にも、法律認識も、そしてクリエイターに対する道徳性も一般人よりは優れてる」と思ってるプロのイラストレーターたち
こいつらがどうしようもない無謀な発言を繰り返し、そして「プロ」だから盲目的な信者たちが沸いて・・・あぁクソが、思い出すだけで冷静じゃなくなる
これは苦情だ
自分の事を「一般人よりは、イラストについて一家言持ってる」と傲慢に思い込み
愚かな風説をまき散らし、自分のファンたちを先導し、結果今の状況を招いた「バカなプロたち」への苦情だ
noteにしょうもない幼稚な反AI論書いてたやつら、全員読んで反省してくれ
1.今どういう状況なのか
3.「プロのイラストレータ」と「クリエイター的な道徳や倫理観、知識の高さ」が相間しない理由。あるいは一般人未満の遵法意識しか持たないわけ
という構成でいく。長くなるから好きなところだけ読んでくれていい
端的に言えば「反AI勢の負け」だ
ただの負けじゃない、だれも想定してなかっただろう最悪の「負け」だ
どんなに異常な「AIイラスト大好き、人力イラストレータを憎んでるぜ!!!」な人でも、
まさか政府が「GalzeやNightShade で機械学習の邪魔する人は、刑事告訴されちゃうかもね。ウフフフフ」なんて気色悪い文章を出すとは思ってなかったはずだ
赤松議員は「ただ、有名漫画家で明確に反対だと言っている人もあまり見かけないですね」なんて、「反AIって弱小漫画家しないよね(笑)」みたいな対立煽りをして、
「日本政府」という枠組みが反AIを冷笑しようとしてる、最悪でしかない
この前提で話をする。この前提に納得できない人は、こんな文章を読むのをやめてパブコメを書きに行こう。俺も書いたよ
一部のバカなプロのイラストレータが本気で理解できてないので書く、
普通の人は理解できてる・・・っていうか知ってると思うので飛ばしてよい
そしてこれが何故ダメなのかは・・・それは「木目百ニ」の事件が簡潔に表現してみせてる、
だからマジでわざわざ俺が説明する必要がない、木目百ニでググってくれ
でもまだ理解できてないプロのイラストレータがいるので説明するが、
ようは日本には「イラストレータの大半が、著作権を重んじなかった」という歴史があるという話
皆勝手に人のキャラクターを脱がせてそれにセクハラをするイラストを描くし、
しかもそれを、イラストサイトの有料コンテンツとして登録して月額課金を稼いだり、ダウンロードサイトに登録して販売する
ブルアカ公式が定めてる「継続的な創作活動のための、原材料費や光熱費諸経費、ツール類など制作にかかった費用程度の対価・利益を得る」を明らかに超過した売り方をして、
多くの人々がそれを買って毎日ブルーアーカイブで過酷なオナニーをしてる。そういう歴史のある国
別にそれが悪いとは言わない、でもその歴史を作ったのは先人と今のイラストレータ達なわけだ
人のキャラクターを勝手に陥没乳首にしたり、勝手にオッサンの子供を身ごもらせたりして、人の著作物でお金を稼いでいる
で、そんな状況で「著作権を重んじよう、創作者に敬意を払おう」ということに、どれだけの意味がある?
どうして「なんだコイツら・・・」って不信の目を向けられないと思ったのか
一つ上の章を読み飛ばさなかった人はもう察しがついてると思うが、
SNSの"大抵"のイラストレータよりも、一般人のほうが実は創作に対して真摯な姿勢を持ってるし、
だって、一般人は「無許可で人のキャラでエロ本を書いて、しかもそれを売って金儲けしたりしない」からだ
せいぜいファンアートレベルだ、500円の月額課金コースに設定したりなんて「一般人」はしない
それを悪とは言わない、版元も喜んでるケースもあるだろう
しかし「著作権」を軽視した態度であることは事実だ、遵法意識という観点で見れば黒だ
SNSやらnoteで反AI論だの、中立ぶって「建設的な議論」だとか「理性的な倫理観」を掲げるイラストレータ達はこの視点が抜けてる
お前たちイラストレータが、ちゃんと著作権や「クリエイターへのリスペクト」について布教啓蒙してればこうはなってない、みんな生成イラストを焼き捨ててただろう
でもそうしなかった、「オリジナルから許可を得てない、エッチなイラストでお金儲けすること」これを良い事だとした
その結果が今だ
普通のイラストを描かない人も、AIイラストを描いて楽しんでる人も、全員お前らより「著作権」に向き合ってる
AI規制の海外判例なんて取り出すな、役に立たねーよ。お前たちがこの国を特別にしたんだろ
偉そうに著作権を語ったり、クリエイターの存続がどうのと言うべきではなかった
AIイラストを楽しんでる庶民に「まぁ、リスペクトはしっかりもって、常識の範囲内でね(笑)」みたいなポーズを取るべきじゃなかった
私は今でも反AI、AI規制論はもっと広く受け入れられる「はずだった」と考えている
「AIイラストなんかが流行ると、若手のイラストレータが食えなくなる」
「集中的にLoraされて、似た絵を量産されると、画風が売りの人は苦しい」
このあたりは、多くの人々に受け入れてもらえる「はずだった」と思ってる
かなり筋の通った意見だし、何よりも「クリエイター」を尊敬してる一般人は本当に多い
でもイラストレータ達はそうしなかった
一般人に頭を下げずに、偉そうに「倫理」だの「道徳」だの「著作権」だの適当なことを吹聴してAIイラストへの攻撃を支持した
「著作権に触れてる」と怒鳴ってAIイラストを捨てさせて、その次の日に自分は二次創作同人の宣伝をした
政府の見解を曲解して吹聴して、それを信じたファン達は盛大に恥をかいた
その結果は?
「反AI」という不名誉なレッテルを張られ、日本政府からは煙たがられ、過激派でひとくくりにされてしまってはいないか?
もう手遅れかもしれないけど、ひょっとしたらまだ何かを変えられるかもしれない
少なくとも私は、変えられると信じてる
EdgeのCopilotにはブログやメールの下書きをしてもらう機能もあるんだけど、
「執筆分野」に「ねこでも分かる!機械学習の「教師あり」と「教師なし」の違い」と入力して
実際に書いてもらった。
ねこでも分かる!機械学習の「教師あり」と「教師なし」の違いとは、こんな感じだにゃ。
「教師あり」は、ねこが人間からごはんをもらうときに、どんな鳴き声を出すと効果的かを学習することだにゃ。
人間が「かわいい」と思う鳴き声にはご褒美があるから、そのパターンを覚えるにゃ。データには正解があって、
それに近づくように学習するにゃ。
はてなテクノロジーのブクマを流し読みしてたら、驚きの意見を見つけて目が点になった。
AI学習対策の保護加工を施したイラストデータができあがるサービス。中国の上海交通大学の研究チームが開発したオープンソースのイラスト保護技術「Mist」を利用し、人間の目で見ても目立たない特殊な電子透かしやノイズを挿入する。これによりAIの正確な学習を妨げ、模倣イラストの生成をある程度阻止することを狙うとしている。
ええ・・・?
機械学習予防のために自作の絵に迷彩を入れたら犯罪になるのか??
そんな可能性は流石に、あり得ないだろ。
条文を見てみた。
1項
人の業務に使用する電子計算機若しくはその用に供する電磁的記録を損壊し、若しくは人の業務に使用する電子計算機に虚偽の情報若しくは不正な指令を与え、又はその他の方法により、電子計算機に使用目的に沿うべき動作をさせず、又は使用目的に反する動作をさせて、人の業務を妨害した者は、5年以下の懲役又は100万円以下の罰金に処する。
2項
前項の罪の未遂は、罰する。
迷彩は「不正な方法」には当たらないだろうが、「その他の方法」により絵を機械学習しにきた「電子計算機に使用目的に沿うべき動作をさせず」機械学習という「業務を妨害した」、とは解釈できる。
うーーむ。
しかしだとすると、オンラインゲームがチーターのパソコンを弾くだけでも電子計算機損壊等業務妨害に当たるとも言えるよね。
これ、条文が悪いよ。
遂にオナサポにもAIの技術(機械学習)が到来!!あなたのおちんぽに合った究極の射精管理を楽しもう!!
はてのの質問に答えたり、実際に簡単なオナニーを行ってからおちんぽの状態を答えたりしながら、あなたのおちんぽを調べ上げます。
(2)オナサポパート(約30分)
おちんちん診断の結果をもとに、射精禁止のままオナニーを強制されます。オナニー中ははてののエロボイスや音が流れるほか、様々なセリフであなたのおちんぽを追い込みます。また、オナサポパートの途中にも射精感についての質問が行われ、射精感の推移を元にオナサポの内容が変化し、より射精限界までおちんぽを責め上げます。
オナサポパート中の射精感の推移を元に、あなたのおちんぽにとって一番気持ちいい射精方法で、精液を搾り取られます。
(4)2回目以降のオナサポ
生成AIに関して詳しく書いてある文章があったので、興味深いと思って読みました。
ttps://note.com/freena_illust/n/ne1442b0563c3?sub_rt=share_b
返歌ではありませんし、技術的根拠も出せませんが、思ったことをまとめたいなあと思いました。
断っておくと、上記の記事に対して肯定的な感情を抱かなかった人が書いてます。
そして生成AIはChatGPTを無料でしか使ったことがない人が書いてます。
嫌な予感がする人は読まないほうがいい。
冒頭で書いたように私は生成AIに詳しくはありません。
でも一応話の軸がぶれないように、最初に主張したいことを述べます。
「高精度なAIには大量の学習データが不可欠だから、権利問題をクリアしても未来はなさそう」です。
先日びっくり発言を見かけました。
曰く、生成AIの技術を認めている人はすべからく盗作を認めている(意訳)、とのことでした。
現在の生成AIツールがそうなっているだけなので、学習元を変えれば権利侵害にはならないはずです。
まあ技術的に可能というだけで実際にそうする人はいないと思いますが。
権利の問題が解決されていないのに生成AIのツールばかり絶賛するものだから、生成AI賛成派は著作権を踏み倒していると解釈されるのは理にかなっているとも思います。
先に述べたように、私は生成AIに限らず、AIという技術が発達すればいいなと思っています。
がしかし、問題があるとすればAIという技術には膨大な学習データが必要で、ネット上にある膨大なデータは全てが著作権フリーではないということです。
さて、件の記事では「無許可のデータを学習」という文がありました。
ふと思ったのですが、逆ならいいのでしょうか。
ですが、「許可されたデータ」の数とはどれほどなのでしょうか。
それで生成できるコンテンツとは何なのでしょう。
ニューラルネットワークの階層が極端に少なく、陳腐なものが成果物となるでしょう。
法で「許可されたデータ」のみを学習対象とするように律することは出来たとしたら、AIの未来はないと思います。
理由は当初に述べたとおりです。
機械学習の本を読んだら寝たので諦めましたが。
それで、だいぶ路線が違うのですが、過去に形態素解析をかじっていたころがありました。
その際に「データ量が少ないと何もできないな」ということを痛感しました。
形態素解析というのは文章をスパスパ区切って順位付けなり分類なりをするというものです。
その文章をスパスパ区切るために、単語の分類と区切りが記載されているであろう「辞書」が必要になります。
「今日魔界ではどちゃくそ雪が降った」という例文があったとして、
単語量の少ない辞書では「今日/魔/界/では/ど/ちゃ/くそ/雪/が/降った」
単語量の多い辞書では「今日/魔界/では/どちゃくそ/雪/が/降った」
になる、というかんじ。
イメージ図なので本当に魔界が分割されるかはわかりませんが、固有語はほとんど未知の単語と認識されて分解されると思います。
無料に頼るからよくないのですが、ネット上の無料の辞書は単語量が少ないため、現代風の言い回しがだいたい判別できません。
ボボボーボ・ボーボボなんてこようものなら、もはや人名とすらも認識されません。
いやどっちかというとマンガ名か?
いいかんじにメンテされてた辞書も、とある日を境に更新されなくなってしまいました。
そんな具合で、当時はデータ量が少ないと何もできないなあと、役に立たねえなあとひしひし感じました。
先ほどの無許可、許可のことを書きながら、このデータ量のことを思い出しました。
文章生成AIであれば、学習する際、単語を分割したり重みづけをしたりする際に相応の辞書を使っているはずです。
要はデータ元もそれを補助するツールも、多くのデータがあればあるほど真価を発揮するはずなのです。
フェイク画像やらなにやらが話題になったのは、サムネイル段階で目を引く造形だったからですよね。
その点では遠目で人の興味を惹く成果物を作れるほどになった技術自体は賞賛すべきものだと思います。
でもそれで作られたものって盗作だよね? という声が聞こる気がしますが……。
私も趣味で絵を書いたり文章を書いたりするので、同一のもの、あるいはひどく酷似したものが他者から後出しで出されたらぞっとします。
この手のものはトレパクというものに当てはまりますが、時系列の証拠を出せばおよそどちらが権利を侵害しているかが認められるものだと思っています。
ただ、生成AIでの成果物は本当に権利を侵害しているのか、という疑問はあります。
ttps://note.com/compass_0000/n/na536a5d16c7a
上記の記事はとある絵師さんのトレパク疑惑について書かれたものです。
記事の内容を見ても、この勝訴した絵師さんはトレパク冤罪をかけられたものだと思えたのですが、某SNSで検索をかけて驚きました。
敗訴した絵師さんをかばい、勝訴した絵師さんを非難するような方が多く見られたのです。
しかも裁判が起こるだいぶ前にこのトレパク問題はとても話題になり、「トレパク疑惑」というところがすっぽ抜けて「トレパク」とだけ把握する人が多数いたようです。
つまり、かの絵師さんには「トレパク疑惑の絵師」から「トレパクの絵師」というレッテルが貼られてしまったのです。
そんな先入観からか、はたまたもう片方の絵師さんを妄信しているのか、ふたりを殆ど知らない私ですら妥当と思った判決結果に疑問を抱く人が世の中にいます。
証拠がはっきりしているトレパク裁判ですら、すべての人が納得出来ていないのです。
(なんでだろうね)
トレパクではしばしば線の重なりが証拠として出されますが、生成AIでの盗作の証拠とは何なのでしょうか。
私の作品を学習してると思います、という見知らぬ絵師さんの引用投稿を以前見かけたことがあります。
こことこことここがその証拠です、と赤丸をつけていた記憶があります。
決して私も詳しいわけではありませんが、かの絵師さんは生成AIの生成過程をご存じないのでは、と思いました。
1枚の絵が与える影響がそんなに大きいとは思えません。
ノイズを出してから1px単位で要素を除外していく、という過程だけを知っていたらそんな言いがかりはつけないと思います。
今、このような方がどれだけいるか分かりませんが、身を守るのだとしたら敵を知るべきです。
思い込みや無知では戦えません。……と思い込みでこの文章を書いている私が言うのも説得力がありませんが。
絵柄を寄せて作り出した成果物であれば話は別です。
あえて特定の絵柄に寄せ続けた成果物を作ることで、模倣元の著作者が得るはずだった利益を奪い取ったと訴えることが可能と考えます。
が、この場合も似ている絵柄などごまんとある、という反証が出来てしまうのかなとも思います。
「学習したことの証拠」よりは「模倣したことの証拠」のほうが敷居が低そうではありますが、それでも茨の道ではあります。
逆に言えば証拠らしい証拠を出せないのが生成AIなのかもしれません。
裏はブラックボックスなので……。仮に問い合わせて計算データ云々を入手できたとしても数値の羅列でしょうし。
現状では、生成AIの成果物は盗作疑惑が永遠に付きまとう、という認識にしかなりえないと思います。
盗作じゃないって証明でないならいいじゃーんって開き直る人がいそうですが、グレーゾーンって喜んでいいのかなあ……。
「高精度なAIには大量の学習データが不可欠だから、権利問題をクリアしても未来はなさそう」です。
データがたくさんあればAIという技術の発展が見込めるけれど、それには権利の問題が立ちふさがる。
仮にそれが権利者の権利を守る段階に来たらAIの発展は終わる。
でも、現状の生成AIの成果物は権利侵害をしているともしていないとも言い切れないのでは?
そう思っています。
NFTがいい例ですが、著作権を持っていたとしても物理的には何の意味もありません。
権利持っている人以外スクショできる機能なんてスマホにはありませんし。
絵を描いたのならばAI学習疎外ツールを使って自己防衛する時代になっています。
正直、盗作盗作いう人たちの決めつけ発言に辟易しますが、グレーゾーンであることは変わりませんし、この先白か黒かに変わることもないと思います。
そうです、私はAIという技術が気になっているだけあって、生成AI技術=盗作ツールというレッテルが貼られるのが嫌だなあと思ってるだけです。
今現在は否定できる証拠もないので、断言はできないでしょ! としか言えないのですが。
AIがうまーく発展してる未来のフィクションはどうやって高精度で大容量なデータットの獲得と権利問題を解決したのでしょう。
フィクションに聞いてもわかりませんね。
そうそう思い出した。
DXが進んだのはコロナの影響という話を以前聞いたんです。
企業がちまちまやっている業務効率化や働き方改革なんてちっとも効果がなくて、COVID19が一番の功績者だったと。
その部分はただの皮肉でしたが、事実でもあるので、人間って環境が変わるとそれに対応していくんだなあとつくづく感じました。
とはいえ、今回話題にしている生成AIはおよそ画像生成AIのことを指しているので、環境変化によって必要に迫られることはないと思います。
何に使うんだろう。
気にはなってるけど傍観者なもんで……。
なんかこう、心理学に似てるような……一般人は何に使うんだろうってなる……専門家は分かってそう……。
技術の発展って難しいですね。
ペンタブで描いたものよりアナログの絵が賞賛されたように、ハイテクはすごい、という先入観があるのかもしれません。
すごいからずるい、になるんでしょうね。
障害があって絵が描けない人が生成AIで絵を出せるようになったという話を見たとき、そういう人もいるのかと感心しました。
乱数要素も絡むため、著作物であると主張できるかはさておいて、想像したものを出力できるのは楽しいと思います。
……使ったことないですけど。