「機械学習」を含む日記

2024-02-23

■NVIDIAとAIの小史

未だに「謎の半導体メーカー」程度の認識の方になぜNVIDIAが時価総額世界4位なのかをあれこれ説明する必要があるので短めにメモ。半導体業界のすみっこの人間なので機械学習まわりの説明は適当です

・～1993年　 AI冬の時代。エージェントシステムがさほど成果を挙げられなかったり。まだ半導体やメモリの性能は現代とくらべてはるかに劣り、現代のような大規模データを用いた統計的処理など考えられなかった。2006年のディープラーニングの発明まで実質的な停滞は続く。

・1993年　 NVIDIA 設立。

・1995年　 NVIDIAが最初のグラフィックアクセラレータ製品NV1を発売。

・1999年　 NVIDIAがGeForce 256発売。GPUという名が初めて使われる。以降、NVIDIAはGPU 業界1位の座を守り続ける。

・2006年　 GPGPU向け開発基盤CUDAを発表。以降、その並列計算に特化した性能を大規模コンピューティングに活用しようという動きが続く。

・2006年　ディープラーニングの発明。のちのビッグデータブームに乗り、これまでよりはるかに高性能なAIを模索する動きが始まる（第3次AI ブームのおこり）

・2006年　 CPU 業界2位のAMDがGPU 業界2位のATIを買収、チップセットにGPUを統合することで事実上自社製品をNVIDIAと切り離す戦略に出る。CPU 業界1位のインテルも、同じく自社CPUに自社製GPUを統合する動きを強める。NVIDIAはこれまでの主力だったGPU チップセット製品の販売を終了し、データセンター向けGPGPUのTeslaシリーズ、ゲーム用外付けGPUのGeForce シリーズ、ARM系CPUと自社GPUを統合したTegra シリーズの3製品に整理する。このうちTeslaシリーズが性能向上やマイクロアーキテクチャ変更を経て現代のAI サーバ製品に直接つながる。GeForce シリーズはゲーマー向け需要や暗号通貨マイニング向け需要も取り込み成長。Tegra シリーズは後継品がNintendoSwitchに採用される。

・2012年　ディープラーニングが画像認識コンテストで圧倒的な成績を収め、実質的な第3次AI ブームが始まる。

・2015年　 AlphaGoがイ・セドルに勝利。

・2016年　 NVIDIAが自動運転向けシステムを発表。

・2017年　Transformerモデル発表。これまでのNN・DLと異なり並列化で性能を上げるのが容易＝デカい計算機を使えばAIの性能が上がる時代に突入。

・2018年　 IBMがNVIDIAと開発した「Summit」がスパコン世界ランキング1位の座を5年ぶりに中国から奪還。全計算のうち96%がGPUによって処理され、HPC（ハイパフォーマンスコンピューティング）におけるGPUの地位は決定的になる。NVIDIAの開発したCPU-GPU間の高速リンク「NVLink」が大規模に活用される。「Summit」は2020年に「富岳」にトップを奪われるまで1位を維持。

・2018~2021年　BERTやXLNet、GPT2など大規模言語モデルの幕開け。まだ研究者が使うレベル。

・2019年　 NVIDIA CEOジェスン・ファン（革ジャンおぢ）が「ムーアの法則は終わった」と見解を表明。半導体のシングルスレッド性能の向上は限界に達し、チップレットを始めとした並列化・集積化アーキテクチャ勝負の時代に入る。

・2022年　 NVIDIAがH100発表。Transformerモデルの学習・推論機能を大幅に強化したサーバ向けGPUで、もはや単体でもスパコンと呼べる性能を発揮する。H100はコアチップGH100をTSMC N4プロセスで製造、SK Hynix製HBMとともにTSMC CoWoSパッケージング技術で集積したパッケージ。※N4プロセスは最新のiPhone向けSoCで採用されたN3 プロセスの1つ前の世代だが、サーバ/デスクトップ製品向けプロセスとモバイル製品向けプロセスはクロックや電流量が異なり、HPC向けはN4が最新と言ってよい。

・2022年　画像生成AI ブーム。DALL-E2、Midjourney、Stable Diffusionなどが相次いで発表。

・2022年　ChatGPT発表。アクティブユーザ1億人達成に2カ月は史上最速。

・2023年　ChatGPT有料版公開。Microsoft Copilot、Google Bard（Gemini）など商用化への動きが相次ぐ。各企業がNVIDIA H100の大量調達に動く。

・2024年　 NVIDIAが時価総額世界4位に到達。半導体メーカー売上ランキング世界1位達成（予定）。

こうして見るとNVIDIAにとっての転換点は「ディープラーニングの発明」「GPGPU向けプログラミング環境 CUDAの発表」「チップセットの販売からコンピューティングユニットの販売に転換」という3つが同時に起こった2006年であると言えそう。以降、NVIDIAはゲーマー向け製品やモバイル向け製品を販売する裏で、CUDAによってGPGPUの独占を続け、仮装通貨マイニングやスパコンでの活躍と言ったホップステップを経て今回の大きな飛躍を成し遂げた、と綺麗にまとめられるだろう。

Permalink | 記事への反応(0) | 04:14

2024-02-21

■anond:20240221155824

いや知ってる知らない以前に機械学習とか全くこの話題に関係ないからね

ある時点で日本国籍を持つ人間全員に試験をして偏差値を測定する

偏差値60未満の人間から日本国籍を剥奪する

すると「偏差値60未満であるために日本国籍を剥奪された人と、日本人」という集団において「日本人全員が偏差値60以上」という状況が成立する

それだけの話

機械学習とか言い出してる時点で「いい加減」なのよ

Permalink | 記事への反応(0) | 15:59

■anond:20240221145224

機械学習って実はもう産業になってるけど意識してないよね？

たぶんそういう部分がメインになると思うんだよね

次にくるのがノーコード・ローコード・RPAの分野、ここが活発になる

そんで5年10年してやっとソフトウェアロボットが普及し始める

産業革命ほどの変化はないとは思うけど、やらなきゃ時代について行けないみたいな存在になるんじゃないかな

スマホ登場の変化よりも少ないと思う

Permalink | 記事への反応(1) | 14:55

■[ゲーム日記]２月２０日

○ご飯

朝：なし。昼：ハンバーガー。夜：キャベツ、人参、ベーコン、大根、きのこのスープ。いりたまご。豆腐。納豆。たくあん。間食：なし。

○調子

むきゅーはややー。おしごとは、むむむむー。

Pythonというか機械学習モデルって難しいなあ、覚えることいっぱいだ。

お勉強の時間が足りてない。

○グランブルーファンタジー

エクスコロぅ周回。

特殊1、攻撃1の省エネ周回で問題なさそうなのでさっさとやろう。

○シャドウバース

ニュートラル進化ロイヤルでMP1000ぐらい溶かしちゃった。

難しい。

選択肢がやたらと多い割に、結局ヴァイスで相手の行動をロックするのが勝ち筋だから勝ってるのか負けてるのかよくわからん。

Permalink | 記事への反応(0) | 00:03

2024-02-19

■生成AIの前に機械学習 ブームがあったじゃん？

あれ一生懸命勉強してた人は無駄になったの？

Permalink | 記事への反応(0) | 18:58

2024-02-08

■小学館に何か言えっつっても無理じゃないかな（追記した）

今回の芦原先生の事件をとても悼ましく思っている。

それはそれとして、小学館への「もっと作家に寄り添え」の大合唱については、小学館もしんどいだろうな…とも思う。

この辺の感想の内訳を、出版業界の端っこ（非漫画系）から自分の知識に基づいて書く。

今回の原作と脚本の問題は、つきつめれば著作者人格権の問題だと考えている。

（仕事上、著作権について多少は調べているが、法律の専門家ではないことは先に付言する）

著作権は、大きく「財産権」と「人格権」に分けられる。

「財産権」とは、そのまま、著作者の財産的利益を守る法律である。

著作物を複製すること、上演・上映・展示・頒布すること、

そして、今回でいうドラマにあたる「二次的著作物」を作る（翻案）／利用することなどは

すべて著作権者の権利であり、第三者が行う場合は許諾が必要だ。

対して「人格権」とは、著作者の「精神的利益」を守る法律である。

公表権・氏名表示権・同一性保持権、つまり著作物を公表するかどうか、名前を出すかどうか、作品の改変を容認するかどうか。

これらは著作者本人のみに決める権利がある。

このふたつの違いは何かというと、

「財産権」は譲渡も相続もできる（著作者でなくても、著作権者にはなりえる）が、

「人格権」は、だれにも譲渡も相続もできない、「著作者本人のみ」にある権利だということだ。

個人的に「精神的利益」とは、ネットスラングで言う「お気持ち」と同義であると考える。

軽んじる意味で言うのではない。

公表するか、名前を出すか、改変してもいいかどうか。つまり、自分の著作物が、自分の納得のいく形で扱われているかどうか。

それによって守られる作者の「気持ち」こそが、法律で守る価値のある、大切な「精神的利益」なのだと思っている。

以上を踏まえて今回の件を見ると、

今回、原作者がドラマ側に繰り返し要望したのは、自身の著作者人格権の尊重だと考える。

もちろんそれ以外にも、著作者には二次的著作物の作成／利用の許諾を行う権利があるのだが、

「ドラマの結末を自分に決めさせてほしい」「キャラクターを変えないでほしい」という要望は、作品世界そのものを守りたい、言い換えれば「同一性保持権」を守りたいという願いのもとに出されたように、私には思える。

そして前述の通り、それは著作者本人の「精神的利益」を守る重要な権利だ。

してみると、小学館が出すべき声明は一つである。

「小学館は、クリエイターの著作者人格権を最大限に尊重する。

そして、取引先企業にも同等の尊重を求める」

法律で決められた権利をあたりまえに尊重する。

ごく当たり前のことである。簡単じゃないか。

簡単じゃないのである。

ここまで書いた通り、著作者人格権とは作者の精神的利益を守る大切な法律だ。

よくわかる。

しかし、出版物の種類によっては、

それ言ってると仕事が回らねえのである。

今回のように著作者一人で本が一冊出来るような漫画や単行本であれば、先生の納得を大切に

進めましょう、といえるだろう。

けれど、たとえば、子供向けの学習ドリルをつくることを想像してほしい。

問題文、解答解説文、ページ内のイラスト、すべて著作物であり、それぞれ著作者がいる。

たとえば「公表権」は著作者人格権のひとつだ。

なので、理屈上は、ドリルのカットイラストを描いたイラストレーターさんが、あるひとつのイラストを指して「このイラストをもう公開したくない」といえばそれは尊重されるべき、となる。

著作財産権ならばお金で解決…つまりイラスト自体の権利を買い取るという交渉もできるが、著作者人格権は譲渡できない。著作者がダメと言ったらダメである。

公表したくない…それは、どこまでの話なのか。もう印刷して積んである在庫は、書店に出回っている在庫は。シール対応か？断裁か？絶版か？

もちろん、そんなことになった例を私は知らないし、たいていのクリエーターさんはこちらの状況を汲んで、たとえば改訂するときに外してください、などの常識的な要望におさめてくれる。

互いの常識と良識のなかで私たちはどうにか仕事をしている。

ところで出版系は契約がルーズだなんて言われるが、最近は結構まじめにやっている（少なくとも私の周りは）。

さて契約書を結ぼうとなると、この著作者人格権については悩ましいところがある。

何せ字義どおりに捉えたら強力すぎる。

著作者人格権を盾に、出版物全体に影響を及ぼすような運用ができるのか、それは判例が出ない限りわからない。わからない以上、我々は会社員なので、裁判沙汰になる芽はできるだけ摘まなければならない。

かくして契約書に、「著作者人格権を行使しない」なんて文言を盛り込む羽目になる。

「著作者人格権の不行使」は契約書では案外よく見る言葉である。

たとえば会社のポスターやパンフレットやDMを発注したとして、取引先の「公表権」で取り下げさせられたり、「同一性保持権」で修正できなかったりする可能性がある…となると、必要性が想像つく人もいるのではないか。

個人的にはこんな文言できれば盛り込みたくない。

クリエイターが本来持つ権利を制限する契約は、誠意に欠けると思っている。

だが、強すぎる権利を放置するのも難しいのだ。

今回の事件は漫画作品なので、カットイラスト1つとはわけが違う…とも思うが、

わけが違うか？ほんとうに？すべての著作物は同等に尊重されるべきでは？？

という思いもある。

クリエイターさんにお仕事をお願いする側のすべての人間が、

100％くもりなく「著作者人格権を尊重します！」と言い切れるかというと…権利の強さゆえに、あまり現実的でない、と思ってしまう。

今回の問題の根幹が「著作者人格権の尊重」をめぐるものだと考えると、小学館全体として声明を出すのは苦しいだろうな…と想像している。

場面や状況によっては制限することさえあるのが現状だからだ。

逆に言えば、それ以外の事情……芦原先生が小学館に対して寄せていた信頼が裏切られてい

た、というような経緯がないことを祈っている。

---------

ちまちま書いていたら小学館から著作者人格権に言及した声明が出ていた。

----------

著作者人格権がトレンドに入っている。

言葉だけが先走りそうで、そして実際権利としてはかなり強いものなのでちょっと先が思いやられる。

なお「じゃあAI 学習は著作者人格権侵害なのでは！？」と盛り上がってる人を見たが、機械学習は私的利用とかと同じ例外規定やで。

Permalink | 記事への反応(10) | 19:35

2024-02-07

■anond:20240207224115

データサイエンティストの募集結構してるしてるやろ。それやれば？

あと機械学習、どういうプロジェクトにどの位置で入るかもよるがフツーに高卒おるが？

Permalink | 記事への反応(0) | 22:43

■anond:20240207222720

いやあ、SWEはコミュ力が重要視されるからまず面接で落ちる（自分は重度の吃音症）し、機械学習エンジニアは修士卒以上じゃないと厳しい（自分は学部卒）だから詰んでるんだよな。

AtCoder jobsに助けを求めたが、職業紹介を断られた。理由は不明。

Permalink | 記事への反応(1) | 22:35

2024-02-06

■ワクチン ツイート 分析における「ワクチン賛成派」とは誰か

解答

フォローアカウントのうち、ワクチン反対ツイートをした/RTしたアカウントの割合が少ないアカウント

まとめ(および私見)

上記解答は「ワクチンに賛成しているグループ」とはイコールではない
元論文では基本的に「反ワクチン性が低い」という表現で書かれており、これを「ワクチン賛成派」とするのはミスリーディングに近い
ワクチン反対派のみを対象とした考察はまだしも、「賛成派」との比較を前提とした考察は正しいのか疑問が残る

人はなぜワクチン反対派になるのか ―コロナ禍におけるワクチンツイートの分析―

https://www.t.u-tokyo.ac.jp/press/pr2024-02-05-001

〈研究の内容〉
本研究はまず、2021年 1月から 12月までに収集された「ワクチン」を含む約1億件のツイートを収集し、機械学習を用いて「ワクチン賛成ツイート」「ワクチン政策批判ツイート」「ワクチン反対ツイート」の3クラスタを抽出した。次に、「ワクチン反対ツイート」を多くつぶやいたりリツイートしているアカウントを特定し、「ワクチン反対ツイート拡散アカウント」として定義した。そして、「ワクチン反対ツイート拡散アカウント」を多くフォローしているユーザを「ワクチン反対派」として定義した。
分析は主に3つの視点から行われた。第1に、ワクチン賛成派と反対派を比較し、反対派の特徴を明らかにした。

ちょっと待て「ワクチン賛成派」って何？

上記プレスリリースの中で「賛成」というワードは4回しか使われておらず、そのいずれにも「賛成派」の定義を示す文というものは存在しない。

幸いにも元論文がPublicで公開されているため、主にMethod項を見てまとめていきたい。

分類方法

1. 「ワクチン」「vaccine」を含む日本語ツイート98,805,971個を取得する。

2. うち2RT以上のツイートのみを検証する。

3. ツイートのクラスタリングを行い、20種のクラスターが作成される。

4. 上位3つ(検証ツイートの99%・リツイートの98%を占める)のクラスター(「ワクチン賛成ツイート;pro-vaccine tweets」「ワクチン政策批判ツイート;opposition to the government’s vaccine policy」「ワクチン反対ツイート;anti-vaccine tweets」)を検討する。

5. 上記3クラスターのツイートを行ったアカウントとRTしたアカウントを集計する(「ワクチン賛成ツイート拡散アカウント:1,382,065」「政府批判拡散アカウント:248,699」「ワクチン反対ツイート拡散アカウント:196,936」)。

6. 上記3種のアカウントからそれぞれ50,000アカウントずつ無作為に抽出し、フォロー中のワクチン反対ツイート拡散アカウントの割合を算出する。

7. "ワクチン反対ツイート拡散アカウント/総フォローアカウント"の割合でソートし、上位25%(全体の12.3%以上)を"High anti-vaccine group"、下位25%(全体の0.24%未満)を"Low anti-vaccine group"とする。

ということで増田冒頭の「フォローアカウントのうち、ワクチン反対ツイートをした/RTしたアカウントの割合が少ないアカウント」ということになる。

これを「賛成派」という言葉で表現するのは実態を表しているようにはみえない。

しかし、元論文においてはこのような表現がほぼされていないといっていい。

基本的に日本語プレスリリースにおける「反対派」「賛成派」は上記メソッドで出たHigh group/Low groupとして表現されている。「反ワクチン性が高いグループ」「反ワクチン性が低いグループ」といったところ。

ただ、「ワクチン反対派」に類するフレーズは度々使われている(元からしてHigh/Low anti-vaccine groupだし)。

一方のLow groupでは、anti-vaccineに対してpro-vaccineという表現が使われている。が、ほぼ全ての用法で発言・ツイートに対してのみ使われており人に対して使われるケースは殆どない(イントロダクションに一回だけある)。

論文では誤解がないような表現にしているにも関わらずプレスリリースで「賛成派」という適切にはみえない表現を使うのはミスリーディングと言われても仕方ないのではないかと感じる。

その他雑な所見

RTと賛同はイコールではないのでは？
賛成派の定義を反対派と同じものにしたり、各アカウントの定義からRTのみのものを除いた場合にも「ワクチン反対派は賛成派と比べて政治的関心が強い」といえるのか？
- 絶対に曲解されるので予め言いますが、「Aといえるのか」とは「Aといえるか分からない」という意味であり「Aではない」という意味ではないです
母集団が「ワクチン関連ツイートをした・RTしたアカウント」であるため、垢分け云々の影響はそこまで大きくないように思える
- 逆に「ワクチン関連に反応したアカウントのみを対象とした検証である」ということは念頭に置いたほうがよい
  - 実際と解離するほどの影響があるかどうかまでは知りません
https://b.hatena.ne.jp/entry/s/twitter.com/konotarogomame/status/1351652834626846720
- サプリ眺めてたらこれがPro-vaccine tweetに分類されててクラスタリングすげえなとなりました
- と同時にpro-vaccine groupをanti-vaccine groupと同様に定義したら河野氏のフォロワー(と、RT者のフォロワー)全員がポジティブ判定になって面倒くさそうだなとも思いました
  - 分類方法がよくないのでは？

参考文献

Toriumi, F., Sakaki, T., Kobayashi, T. et al. Anti-vaccine rabbit hole leads to political representation: the case of Twitter in Japan. J Comput Soc Sc (20 24). https://doi.org/10.1007/s42001-023-00241-8

Permalink | 記事への反応(10) | 19:39

2024-01-31

■anond:20240131140021

NNとかXGBとか、機械学習以外のソフトウェア開発に比べるとずいぶん楽だよな。給料もいい。なのに競争がそこまで激しくない。

Permalink | 記事への反応(0) | 16:20

■すべてがAIになる

「機械学習」や「深層学習」という言葉が死語になったとまではいわないまでもめっきり使われなくなって

今じゃすべてが「AI」に統合されたような気がしている

でも「強化学習」は別カテゴリとしてまだ生き延びている感じがする

Permalink | 記事への反応(0) | 10:04

2024-01-30

■anond:20240130214218

私的利用プラス生成AI ← これの時点でもう地獄。

素人を脱がせたコラの私的利用が合法なのは、流通を止めるだけで十分だったから。

だけど機械学習の発展は、前提を完全に破壊する。

Permalink | 記事への反応(0) | 22:50

■anond:20240130214218

❶ 機械学習は人間の脳と同じ

❷ 猿のような男子中学生は、学びを共にする仲間である女子中学生を想像で好き勝手する

❸ ゆえに、自宅で生成ＡＩでクラスメイトの裸をコラージュする男子中学生は、脳内で想像してマスターベーションする男子と同じ

同級生の写真でポルノを作って自分だけで楽しむようになると思う。

Permalink | 記事への反応(0) | 21:58

2024-01-29

■生成AI推進派も反対派も「議論する以前の状況」を脱しよう

今日のハテブで下のようなブログが上がっていた

"24/1/28 「生成AIの『学習』は学術用語だ」ということをそろそろちゃんと説明した方がいい"

https://saize-lw.hatenablog.com/entry/2024/01/28/210053

いまだにこのレベルの内容がバズってるのを見ると少し辟易させられるが

考えてみると、ちゃんと技術を理解してる人間すらこのレベルのことしか書けないのは

対話の場がなくお互いの言葉尻をとらえてる状況が悪いと思うので少し整理して書こうと思う。

生成AIをめぐる問題の最大の面倒くさいポイントは

・現時点での著作権の運用がよく理解されていない

・著作権をめぐる法理が日々変化しつつあることが理解されていない

という二重の難しさにある。

単に概念的に難しいというだけではなく、日本においては法制度の実装レベルですでに混乱が生じている。

とくに生成AIと著作権を語るにあたっては「フェアユースという発想に賛同するか否か」という観点が必要不可欠なのだが

日本においては一般のフェアユースの法理が未整備なのに

一足飛びに機械学習だけ著作権法30条の4によってフェアユース的発想が導入されているという

非常に奇妙な状況になっている。

フェアユースとは何か、というのは非常に難しい。

「一定程度の公正さがあれば具体的な類型を列挙しなくても著作権を制限できるという考え」

とでも要約できるが、これだけでは意味不明だろう。

英国にフェアディーリングというものがあるが、こっちの「公正さ」はわかりやすい。

フェアディーリングは英国を含む英連邦の法体系にある発想で

「非営利かつ研究や教育目的、批評、報道などの場合は著作権は制限される」ということ。

たとえばこれがなければ公営の学校や図書館は莫大な支払いに追われ成立しえない以上

「公正さ」のために著作権を制限してよいという発想はわかりやすく

近代以降の文明国でこれを否定するような法理はまず存在しえないだろう。

フェアディーリングそのものではないが、EUの情報社会指令第5条なども同じように

「公正さは基本的に非営利や少なくとも公益目的、かつ具体的にあらかじめ列挙される」という発想である。

しかし、フェアユースはそういう単純な話ではない。

「営利でも、今までに判例がなくても、抽象的な議論で公正さを主張できれば新しく著作権を制限できるケースを創れる」

というのがフェアユースなのだ。

ただし、元の著作権者の利益を「不当に」害さない範囲で。何が不当か？それはよくわからんので最高裁まで争いましょう。

一見すると無茶にも思えるが、現代人の多くはこの法理の恩恵を受け、著作権を制限することで利益を得る側だ。

最も影響が大きいのはインターネット検索。

フェアディーリングの発想だけでは、検索エンジンのサジェスト機能すら著作権的にアウトということになる。

それを「フェア」にしたのは、米国著作権法に組み込まれたフェアユースの発想なのだ。

サジェスト機能だけでなく、情報技術を用いた新サービスが興るたびに多くの裁判が発生している。

ただし問題点は、それがフェアユースだと認められたとしても、EUの法理で「いや、この機能は著作権的にアウトだ、金払え」ということも現時点ですら可能であるということだ。というか実際にそういう判決はそれなりの頻度で発生している。

だってフェアユースはあくまで米国を含む一部の国でしか確立していないのだから。

しかし、現実問題として、それなりに有用なwebサービスを立ち上げようと思えば、まずフェアユース的発想に頼らざるを得ないだろう。

そもそも、著作権の発想はインターネット以前のものだ。

そこでいわれている「引用」は基本的に紙媒体で実名の人物が著作で相互引用する低速で静的な状況を想定しており

インターネットでアルゴリズムやボットを含む様々なエージェントが高速で動的に情報をやり取りする状況は考慮外だ。

もちろん、法の運用上はそれらに解釈を加え、少しずつ判例を積み重ね、法的に許される状態を少しずつ拡張していくわけだが

その結果が「サジェストは権利侵害です」となるのと、「フェアユースなので許可」となるのとでは、新サービス市場の発展速度が圧倒的に違う。

ネット民になじみが深いのは二次創作やミームだろう。

これらは基本的に著作権侵害であるが、訴訟を起こす利益などが小さすぎるため放置されているに過ぎない。

しかし例えば、訴訟が大幅に簡素化・自動化され、二次創作やミームが不可能となる社会を人々は望むだろうか？

ここで問題は、「フェアユース」が正しいか、ではない。

究極的には、「どちらを選びたいか」という話になってくる。

もちろん、自分でどちらかを選びたいからと言って、それが自分の国の法理として実装できるかというと、大抵はそれは別問題だ。

フェアユースの発想を頑として認めない米国民がいたとして、如何なロビー活動の天才でも、死ぬまでに合衆国法典第17編第107条を改正するにこぎつけるのはまず不可能だろう。

逆に欧州の新進気鋭の政治家がEUの現状を憂い情報社会指令第5条を全面撤廃・改正してフェアユース的発想を導入できるだろうか？

全政治生命を賭したとしても、やはり死ぬまでにやり遂げるのは無理だろう。

しかし日本は違う。

はっきり言って日本における法改正のハードルは低い。

すでに著作権法30条の4が存在しているというのがそれを端的に示している。

しかもそれほど政治的な紛争もなくぬるっと成立した、としか言いようがない成立過程である。

これは「元の著作物に表現された思想又は感情の享受」以外なら、営利目的でも無許可で機械学習を行っていいとするものだ。

ただしここにはやはり「フェアさ」は必要で、その条件は「元の著作権者の利益を不当に害さない」という抽象的なものだ。

現時点では確固たる判例はないので、大型の訴訟が起きてから決まることになるのだろう。

これはかなり米国っぽい、フェアユース的発想である。

前述したとおり、日本の著作権法にはもともとフェアユースの発想はない。

それにもかかわらずいきなりこれがぬるっと成立するというのは、ある意味特殊な日本の政治状況、法体系の面白さというほかない。

そしてこれを「所与の動かしがたい条件」とみなす理由もない。

ぬるっと成立した以上、ぬるっと撤廃されることだってありうるのだ。

ともかく、日本においてはいろいろロビー活動の余地、法改正の可能性、政治闘争で結果が変わる余地が多分に残されている。

だが以下は整理しておくべきだろう。

・あなたはフェアユース的発想を認めるのか、認めないのか？

・フェアユース的発想を認めたとして、生成AIの利用はどのような具体的なケースでどうフェア・アンフェアなのか？

これは非常に難しい問いだと思う。私が答えるなら

(1)

フェアユースは認める。そもそもインターネット時代にそれ以前の著作権法を解釈と判例でそのまま運用する発想は無茶。

二次著作物の利用や検索エンジンなどのwebサービスを「基本はアウトだが、訴訟コストが支払えないから事実上セーフ」という現状はいびつすぎるのはもちろんのこと、訴訟コストが簡素化されてそれらが制限される状況が公正とも思えない。

(2)

生成AIにおいて元著作物と生成物の市場での利用形態が完全に競合する場合はフェアユースを認めたとしても「不公正」といえる。そもそもフェアユースはあくまで「新しい市場の開拓」という米国的な大義名分があって初めて成立する。

イラストを売っている販売元と同じようなプラットフォームで再販売するような場合は市場拡大していないし不公正だろう。

逆にそうではないケース、元データの市場と新データの市場がバッティングしない場合にはフェアユース的発想で公正とされると思う。

というあたりになるだろうか。

みなさんもまずこれを考えてみてほしい。ここを明確にして初めて議論の価値が生まれるといえるだろう。

Permalink | 記事への反応(2) | 18:55

2024-01-26

■anond:20240126020048

周辺情報も含めてもう少し俺自身が咀嚼する必要があると思った

あとで調べるためのコメント

以下自分用メモ(☆は自分が書いたもの)

AIによる学習を阻害する技術に対する法的措置の可能性

GalzeやNightShade で機械学習の邪魔する人は、刑事告訴されちゃうかもね。ｳﾌﾌﾌﾌ

☆これのことか？

AIの発展を邪魔するAIは犯罪と政府が認定！『TIME』誌が選ぶ最優秀発明Glaze Nightshade

https://togetter.com/li/2275902

↓

第4回AI 時代の知的財産権検討会の資料が公開。我々が送った意見は「資料5」にまとまっている。自分の意見がちゃんと載っているかご確認を。……まあ載っていたとしても結局会議内容に反映されてないっぽいのが最悪なんだが。30条4に対して未だにコレだよ

https://twitter.com/numatakeja/status/1734490907410571461

↓

AI 時代の知的財産権検討会（第４回）議事次第

https://www.kantei.go.jp/jp/singi/titeki2/ai_kentoukai/gijisidai/dai4/index.html

資料４ AI 時代の知的財産権検討会　論点整理

https://www.kantei.go.jp/jp/singi/titeki2/ai_kentoukai/gijisidai/dai4/siryou4.pdf (P.18)

☆現状の記述。下線が引かれていないので要検討項目とは見なされていない

AI イラストに規制を求める団体 理事の不祥事について

「木目百ニ」の事件

AI イラストに規制を求める団体の理事「木目百二」氏が二次創作のガイドライン違反で支援サイトの作品全消し、謝罪に追い込まれる

https://togetter.com/li/2135111

会の理事である木目百二氏が成人向け二次創作で収益を得ていることが発覚

木目百二氏が二次創作作品を削除、謝罪

https://twitter.com/mokumemomoji/status/1651958062482337792 (☆2024/1/27現在アカウントが凍結されているため見ることができない)

一次創作物の二次利用に関するガイドラインの一例と、二次創作による収入について

ブルアカ公式が定めてる「継続的な創作活動のための、原材料費や光熱費諸経費、ツール類など制作にかかった費用程度の対価・利益を得る」を明らかに超過した売り方をして、
多くの人々がそれを買って毎日ブルーアーカイブで過酷なオナニーをしてる

☆過剰な収入があったとする根拠は見つけることができなかった

ブルーアーカイブ公式二次創作ガイドライン

https://bluearchive.jp/fankit/guidelines

★二次創作を行う者について★

個人または法人格のない団体は、後述するような当社が定義する「非営利目的」の場合に限り、「ブルーアーカイブ」を題材とした二次創作物（同人誌・同人グッズ・デジタル作品など…）の制作・配布・頒布を自由に行っていただいて問題ありません。

★非営利/営利目的とみなす判断基準★

個人または法人格のない団体は、非営利目的かつ日本国内での発表・流通の場合に限り、自由に二次創作物を制作していただいて問題ありません。

また、趣味の範囲で利用し、継続的な創作活動のための、原材料費や光熱費諸経費、ツール類など制作にかかった費用程度の対価・利益を得る場合においても非営利目的の範囲内とします。

そのほか

散々著作権を軽視して無法地帯になったイラスト界隈を自分たちが作ったのに、なに「思想家」ぶって人に説教してるわけ？
端的に言えば「一般人を見下した態度を取るべきではなかった」これに尽きる
一般人に頭を下げずに、偉そうに「倫理」だの「道徳」だの「著作権」だの適当なことを吹聴してAI イラストへの攻撃を支持した
「著作権に触れてる」と怒鳴ってAI イラストを捨てさせて、その次の日に自分は二次創作同人の宣伝をした
政府の見解を曲解して吹聴して、それを信じたファン達は盛大に恥をかいた

☆どこかに反AI 絵師視点の意見が整理されているところがあればいいのだが、見つけられなかった

☆事実関係については検証可能な情報がほしいところ

Permalink | 記事への反応(0) | 16:36

■anond:20240126020048

まさか政府が「GalzeやNightShade で機械学習の邪魔する人は、刑事告訴されちゃうかもね。ｳﾌﾌﾌﾌ」なんて気色悪い文章を出すとは思ってなかったはずだ

そんなん言ってたっけ？どれのこと？

Permalink | 記事への反応(1) | 16:27

■anond:20240126020048

政府が「GalzeやNightShade で機械学習の邪魔する人は、刑事告訴されちゃうかもね。ｳﾌﾌﾌﾌ」なんて気色悪い文章を出す

これ何のこと？

ググっても情報でないんだけど

Permalink | 記事への反応(2) | 16:23

■一人のAI 規制派(ようは反AI)として、SNSの思想家気取りの反AI勢に思う事

前書き「害悪でしかないからマジでやめろ」

俺は所謂反AI 思想だ、ラッダイト的と批判されても「そうだ」と言い返す。それぐらいに反AIだ

だがSNSやらnoteでワイワイ反AI論じてる奴らに頭に来てる、はっきり言って害悪だ

本当に害悪だ、誰のためにもなってない、いい加減にしろと思う

具体的には「自分のことを倫理的にも、法律認識も、そしてクリエイターに対する道徳性も一般人よりは優れてる」と思ってるプロのイラストレーターたち

こいつらがどうしようもない無謀な発言を繰り返し、そして「プロ」だから盲目的な信者たちが沸いて・・・あぁクソが、思い出すだけで冷静じゃなくなる

これは苦情だ

自分の事を「一般人よりは、イラストについて一家言持ってる」と傲慢に思い込み

愚かな風説をまき散らし、自分のファンたちを先導し、結果今の状況を招いた「バカなプロたち」への苦情だ

noteにしょうもない幼稚な反AI 論書いてたやつら、全員読んで反省してくれ

1.今どういう状況なのか

2.反AI 勢力は何に失敗したのか

3.「プロのイラストレータ」と「クリエイター的な道徳や倫理観、知識の高さ」が相間しない理由。あるいは一般人未満の遵法意識しか持たないわけ

4.どうあるべきだったか、どう祈るべきだったか

という構成でいく。長くなるから好きなところだけ読んでくれていい

(注意：以降「イラストレータ」という単語はこの文章では、「同人 コンテンツでお金を稼いでる＋SNSで積極的に活動してるイラストレータ」のみを指します。そうじゃないイラストレータはこの文章の対象じゃないです)

1.今(2024/1/25)どういう状況なのか

端的に言えば「反AI勢の負け」だ

ただの負けじゃない、だれも想定してなかっただろう最悪の「負け」だ

どんなに異常な「AI イラスト大好き、人力イラストレータを憎んでるぜ！！！」な人でも、

まさか政府が「GalzeやNightShade で機械学習の邪魔する人は、刑事告訴されちゃうかもね。ｳﾌﾌﾌﾌ」なんて気色悪い文章を出すとは思ってなかったはずだ

赤松議員は「ただ、有名漫画家で明確に反対だと言っている人もあまり見かけないですね」なんて、「反AIって弱小漫画家しないよね(笑)」みたいな対立煽りをして、

「日本政府」という枠組みが反AIを冷笑しようとしてる、最悪でしかない

反AIは苦境に立たされてるし、事実上の撤退戦の状況にある

この前提で話をする。この前提に納得できない人は、こんな文章を読むのをやめてパブコメを書きに行こう。俺も書いたよ

2.反AI 勢力は何に失敗したのか

正直この説明いるか？って思ってるのだが、

一部のバカなプロのイラストレータが本気で理解できてないので書く、

普通の人は理解できてる・・・っていうか知ってると思うので飛ばしてよい

端的に言えば「著作権、意匠権で戦おうとしたこと」に尽きる

そしてこれが何故ダメなのかは・・・それは「木目百ニ」の事件が簡潔に表現してみせてる、

だからマジでわざわざ俺が説明する必要がない、木目百ニでググってくれ

でもまだ理解できてないプロのイラストレータがいるので説明するが、

ようは日本には「イラストレータの大半が、著作権を重んじなかった」という歴史があるという話

皆勝手に人のキャラクターを脱がせてそれにセクハラをするイラストを描くし、

しかもそれを、イラストサイトの有料コンテンツとして登録して月額課金を稼いだり、ダウンロードサイトに登録して販売する

ブルアカ公式が定めてる「継続的な創作活動のための、原材料費や光熱費諸経費、ツール類など制作にかかった費用程度の対価・利益を得る」を明らかに超過した売り方をして、

多くの人々がそれを買って毎日ブルーアーカイブで過酷なオナニーをしてる。そういう歴史のある国

別にそれが悪いとは言わない、でもその歴史を作ったのは先人と今のイラストレータ達なわけだ

今日も多くのイラストレータ達が二次創作で経済を廻してる

人のキャラクターを勝手に陥没乳首にしたり、勝手にオッサンの子供を身ごもらせたりして、人の著作物でお金を稼いでいる

で、そんな状況で「著作権を重んじよう、創作者に敬意を払おう」ということに、どれだけの意味がある？

どうして「なんだコイツら・・・」って不信の目を向けられないと思ったのか

3.「プロのイラストレータ」と「クリエイター的な道徳や倫理観、知識の高さ」が相関しない理由。あるいは一般人未満の遵法意識 しか持たないわけ

一つ上の章を読み飛ばさなかった人はもう察しがついてると思うが、

SNSの"大抵"のイラストレータよりも、一般人のほうが実は創作に対して真摯な姿勢を持ってるし、

もっと言えば著作権への理解もしっかりしてる

だって、一般人は「無許可で人のキャラでエロ本を書いて、しかもそれを売って金儲けしたりしない」からだ

せいぜいファンアートレベルだ、500円の月額課金コースに設定したりなんて「一般人」はしない

しかし、イラストレーター達はそれをやる

それを悪とは言わない、版元も喜んでるケースもあるだろう

しかし「著作権」を軽視した態度であることは事実だ、遵法意識という観点で見れば黒だ

私が特に問題視してるのはこの点だ

SNSやらnoteで反AI論だの、中立ぶって「建設的な議論」だとか「理性的な倫理観」を掲げるイラストレータ達はこの視点が抜けてる

散々著作権を軽視して無法地帯になったイラスト界隈を自分たちが作ったのに、なに「思想家」ぶって人に説教してるわけ？

お前たちイラストレータが、ちゃんと著作権や「クリエイターへのリスペクト」について布教啓蒙してればこうはなってない、みんな生成イラストを焼き捨ててただろう

でもそうしなかった、「オリジナルから許可を得てない、エッチなイラストでお金儲けすること」これを良い事だとした

その結果が今だ

その現実から目をそらして、人を批難するのはやめろ

普通のイラストを描かない人も、AI イラストを描いて楽しんでる人も、全員お前らより「著作権」に向き合ってる

お前が一番非建設的で、非理性的で、愚かだ

そしてそんなお前らが築き上げた帝国がこのクールジャパンだよ

AI 規制の海外判例なんて取り出すな、役に立たねーよ。お前たちがこの国を特別にしたんだろ

4.どうあるべきだったか、どう祈るべきだったか

反AI勢が本当にすべきだったこと、

端的に言えば「一般人を見下した態度を取るべきではなかった」これに尽きる

偉そうに著作権を語ったり、クリエイターの存続がどうのと言うべきではなかった

AI イラストを楽しんでる庶民に「まぁ、リスペクトはしっかりもって、常識の範囲内でね（笑）」みたいなポーズを取るべきじゃなかった

私は今でも反AI、AI 規制論はもっと広く受け入れられる「はずだった」と考えている

もっと広く支持される意見になったはずだと思っている

「AI イラストなんかが流行ると、若手のイラストレータが食えなくなる」

「集中的にLoraされて、似た絵を量産されると、画風が売りの人は苦しい」

「私の絵は私の物なので、学習されない権利も持てるはずだ」

このあたりは、多くの人々に受け入れてもらえる「はずだった」と思ってる

かなり筋の通った意見だし、何よりも「クリエイター」を尊敬してる一般人は本当に多い

SNSのオタクはみんなクリエイターのことが大好きだ

でもイラストレータ達はそうしなかった

一般人に頭を下げずに、偉そうに「倫理」だの「道徳」だの「著作権」だの適当なことを吹聴してAI イラストへの攻撃を支持した

「著作権に触れてる」と怒鳴ってAI イラストを捨てさせて、その次の日に自分は二次創作同人の宣伝をした

政府の見解を曲解して吹聴して、それを信じたファン達は盛大に恥をかいた

その結果は？

「反AI」という不名誉なレッテルを張られ、日本政府からは煙たがられ、過激派でひとくくりにされてしまってはいないか？

文化庁のパブコメの締め切りは2月12日

もう手遅れかもしれないけど、ひょっとしたらまだ何かを変えられるかもしれない

少なくとも私は、変えられると信じてる

あなたたちも変わるべきだ

追記「自分語り、読まなくてもいいです」

余計で、人のツイートの誤読を含んだ、不適切で攻撃的な悪文が書かれていたので削除

Permalink | 記事への反応(29) | 02:00

2024-01-22

■

EdgeのCopilotにはブログやメールの下書きをしてもらう機能もあるんだけど、

「執筆分野」に「ねこでも分かる！機械学習の「教師あり」と「教師なし」の違い」と入力して

実際に書いてもらった。

ねこでも分かる！機械学習の「教師あり」と「教師なし」の違いとは、こんな感じだにゃ。

「教師あり」は、ねこが人間からごはんをもらうときに、どんな鳴き声を出すと効果的かを学習することだにゃ。
人間が「かわいい」と思う鳴き声にはご褒美があるから、そのパターンを覚えるにゃ。データには正解があって、
それに近づくように学習するにゃ。

「教師なし」は、ねこが自分でごはんを探すときに、どんな場所や匂いに注目するかを学習することだにゃ。
人間が教えてくれないから、自分でパターンを見つけるにゃ。データには正解がなくて、それぞれの特徴を分類するにゃ。

Permalink | 記事への反応(2) | 21:43

■anond:20240122211936

チートは利用規約違反だから弾くのは正当な行為だが、機械学習に使うのは現状法律違反ではないからねえ

Permalink | 記事への反応(0) | 21:29

■anond:20240122205528

機械学習予防が犯罪って…… 悪いのは機械学習の方じゃないの？どっちかっていうと。

Permalink | 記事への反応(2) | 21:19

■機械学習予防が…… 犯罪？

はてなテクノロジーのブクマを流し読みしてたら、驚きの意見を見つけて目が点になった。

AI 学習対策の保護加工を施したイラストデータができあがるサービス。中国の上海交通大学の研究チームが開発したオープンソースのイラスト保護技術「Mist」を利用し、人間の目で見ても目立たない特殊な電子透かしやノイズを挿入する。これによりAIの正確な学習を妨げ、模倣イラストの生成をある程度阻止することを狙うとしている。

未遂であろうと絵師は公開した時点で電子計算機損壊等業務妨害罪に問われる可能性あり。
[B! AI] イラストをAIの無断学習から保護する無料サービス「emamori」の注目コメントトップより

ええ・・・？

機械学習予防のために自作の絵に迷彩を入れたら犯罪になるのか？？

そんな可能性は流石に、あり得ないだろ。

条文を見てみた。

刑法234条の2（電子計算機損壊等業務妨害）
1項
　人の業務に使用する電子計算機若しくはその用に供する電磁的記録を損壊し、若しくは人の業務に使用する電子計算機に虚偽の情報若しくは不正な指令を与え、又はその他の方法により、電子計算機に使用目的に沿うべき動作をさせず、又は使用目的に反する動作をさせて、人の業務を妨害した者は、5年以下の懲役又は100万円以下の罰金に処する。
2項
　前項の罪の未遂は、罰する。

迷彩は「不正な方法」には当たらないだろうが、「その他の方法」により絵を機械学習しにきた「電子計算機に使用目的に沿うべき動作をさせず」機械学習という「業務を妨害した」、とは解釈できる。

うーーむ。

しかしだとすると、オンラインゲームがチーターのパソコンを弾くだけでも電子計算機損壊等業務妨害に当たるとも言えるよね。

これ、条文が悪いよ。

警察には柔軟な法の運営を期待したい。善のサービス、無辜の市民に罪を着せないでほしい。

Permalink | 記事への反応(2) | 20:55

2024-01-18

■anond:20240118220845

なら特定絵師を機械学習させるのも内心の自由になるんじゃね

Permalink | 記事への反応(0) | 22:12

2024-01-14

■オナサポAI はての

遂にオナサポにもAIの技術(機械学習)が到来!!あなたのおちんぽに合った究極の射精管理を楽しもう!!

(1)おちんちん診断(約5分～10分)

はてのの質問に答えたり、実際に簡単なオナニーを行ってからおちんぽの状態を答えたりしながら、あなたのおちんぽを調べ上げます。

(2)オナサポパート(約30分)

おちんちん診断の結果をもとに、射精禁止のままオナニーを強制されます。オナニー中ははてののエロボイスや音が流れるほか、様々なセリフであなたのおちんぽを追い込みます。また、オナサポパートの途中にも射精感についての質問が行われ、射精感の推移を元にオナサポの内容が変化し、より射精限界までおちんぽを責め上げます。

(3)射精許可(約5分)

オナサポパート中の射精感の推移を元に、あなたのおちんぽにとって一番気持ちいい射精方法で、精液を搾り取られます。

(4)2回目以降のオナサポ

前回のオナサポ結果をもとに、さらにあなたのおちんぽに合ったオナサポを受けることができます。

また、場合によってははてのと〇〇〇をして射精することができるかも…?

Permalink | 記事への反応(0) | 16:45

2024-01-10

■生成AIのこと

生成AIに関して詳しく書いてある文章があったので、興味深いと思って読みました。

ttps://note.com/freena_illust/n/ne1442b0563c3?sub_rt=share_b

返歌ではありませんし、技術的根拠も出せませんが、思ったことをまとめたいなあと思いました。

断っておくと、上記の記事に対して肯定的な感情を抱かなかった人が書いてます。

そして生成AIはChatGPTを無料でしか使ったことがない人が書いてます。

そうです、あいあむ無知……。

嫌な予感がする人は読まないほうがいい。

最初に

冒頭で書いたように私は生成AIに詳しくはありません。

最近話題になってるなあと思ってるくらいの人間です。

なので多分脱線をたくさんします。

でも一応話の軸がぶれないように、最初に主張したいことを述べます。

「高精度なAIには大量の学習データが不可欠だから、権利問題をクリアしても未来はなさそう」です。

盗作 ツールとして名高いらしい

先日びっくり発言を見かけました。

曰く、生成AIの技術を認めている人はすべからく盗作を認めている（意訳）、とのことでした。

現在の生成AI ツールがそうなっているだけなので、学習元を変えれば権利侵害にはならないはずです。

まあ技術的に可能というだけで実際にそうする人はいないと思いますが。

権利の問題が解決されていないのに生成AIのツールばかり絶賛するものだから、生成AI賛成派は著作権を踏み倒していると解釈されるのは理にかなっているとも思います。

先に述べたように、私は生成AIに限らず、AIという技術が発達すればいいなと思っています。

しかしそれと盗作を認めることはイコールではありません。

がしかし、問題があるとすればAIという技術には膨大な学習データが必要で、ネット上にある膨大なデータは全てが著作権フリーではないということです。

さて、件の記事では「無許可のデータを学習」という文がありました。

ふと思ったのですが、逆ならいいのでしょうか。

いいと思います。許可されたデータなので。

ですが、「許可されたデータ」の数とはどれほどなのでしょうか。

当然ながら「無許可のデータ」よりも少ないと予測できます。

それで生成できるコンテンツとは何なのでしょう。

ニューラルネットワークの階層が極端に少なく、陳腐なものが成果物となるでしょう。

（階層型しか知らなくてごめんなさい）

法で「許可されたデータ」のみを学習対象とするように律することは出来たとしたら、AIの未来はないと思います。

理由は当初に述べたとおりです。

データが多いほど幸せになれるかも

実は超解像を試そうと奮闘した過去はあります。

機械学習の本を読んだら寝たので諦めましたが。

それで、だいぶ路線が違うのですが、過去に形態素解析をかじっていたころがありました。

その際に「データ量が少ないと何もできないな」ということを痛感しました。

形態素解析というのは文章をスパスパ区切って順位付けなり分類なりをするというものです。

その文章をスパスパ区切るために、単語の分類と区切りが記載されているであろう「辞書」が必要になります。

「今日魔界ではどちゃくそ雪が降った」という例文があったとして、

単語量の少ない辞書では「今日/魔/界/では/ど/ちゃ/くそ/雪/が/降った」

単語量の多い辞書では「今日/魔界/では/どちゃくそ/雪/が/降った」

になる、というかんじ。

イメージ図なので本当に魔界が分割されるかはわかりませんが、固有語はほとんど未知の単語と認識されて分解されると思います。

無料に頼るからよくないのですが、ネット上の無料の辞書は単語量が少ないため、現代風の言い回しがだいたい判別できません。

ボボボーボ・ボーボボなんてこようものなら、もはや人名とすらも認識されません。

いやどっちかというとマンガ名か？

いいかんじにメンテされてた辞書も、とある日を境に更新されなくなってしまいました。

そんな具合で、当時はデータ量が少ないと何もできないなあと、役に立たねえなあとひしひし感じました。

先ほどの無許可、許可のことを書きながら、このデータ量のことを思い出しました。

文章生成AIであれば、学習する際、単語を分割したり重みづけをしたりする際に相応の辞書を使っているはずです。

日本語おかしくないですもん。

人がスクショした文章しか見たことないけど。

だいぶ脱線しました。

要はデータ元もそれを補助するツールも、多くのデータがあればあるほど真価を発揮するはずなのです。

フェイク画像やらなにやらが話題になったのは、サムネイル段階で目を引く造形だったからですよね。

下手な絵をAIで作ったとしても話題になりませんし。

その点では遠目で人の興味を惹く成果物を作れるほどになった技術自体は賞賛すべきものだと思います。

でもそれで作られたものって盗作だよね？　という声が聞こる気がしますが……。

どこから 盗作になるのか

権利は尊重されるべきものだと思います。

私も趣味で絵を書いたり文章を書いたりするので、同一のもの、あるいはひどく酷似したものが他者から後出しで出されたらぞっとします。

この手のものはトレパクというものに当てはまりますが、時系列の証拠を出せばおよそどちらが権利を侵害しているかが認められるものだと思っています。

ただ、生成AIでの成果物は本当に権利を侵害しているのか、という疑問はあります。

話が再び逸れますが、以前トレパク裁判の話を見かけました。

ttps://note.com/compass_0000/n/na536a5d16c7a

上記の記事はとある絵師さんのトレパク疑惑について書かれたものです。

記事の内容を見ても、この勝訴した絵師さんはトレパク冤罪をかけられたものだと思えたのですが、某SNSで検索をかけて驚きました。

敗訴した絵師さんをかばい、勝訴した絵師さんを非難するような方が多く見られたのです。

しかも裁判が起こるだいぶ前にこのトレパク問題はとても話題になり、「トレパク疑惑」というところがすっぽ抜けて「トレパク」とだけ把握する人が多数いたようです。

つまり、かの絵師さんには「トレパク疑惑の絵師」から「トレパクの絵師」というレッテルが貼られてしまったのです。

そんな先入観からか、はたまたもう片方の絵師さんを妄信しているのか、ふたりを殆ど知らない私ですら妥当と思った判決結果に疑問を抱く人が世の中にいます。

証拠がはっきりしているトレパク裁判ですら、すべての人が納得出来ていないのです。

（なんでだろうね）

トレパクではしばしば線の重なりが証拠として出されますが、生成AIでの盗作の証拠とは何なのでしょうか。

私の作品を学習してると思います、という見知らぬ絵師さんの引用投稿を以前見かけたことがあります。

こことこことここがその証拠です、と赤丸をつけていた記憶があります。

決して私も詳しいわけではありませんが、かの絵師さんは生成AIの生成過程をご存じないのでは、と思いました。

1枚の絵が与える影響がそんなに大きいとは思えません。

ノイズを出してから1px単位で要素を除外していく、という過程だけを知っていたらそんな言いがかりはつけないと思います。

今、このような方がどれだけいるか分かりませんが、身を守るのだとしたら敵を知るべきです。

思い込みや無知では戦えません。……と思い込みでこの文章を書いている私が言うのも説得力がありませんが。

絵柄を寄せて作り出した成果物であれば話は別です。

あえて特定の絵柄に寄せ続けた成果物を作ることで、模倣元の著作者が得るはずだった利益を奪い取ったと訴えることが可能と考えます。

が、この場合も似ている絵柄などごまんとある、という反証が出来てしまうのかなとも思います。

「学習したことの証拠」よりは「模倣したことの証拠」のほうが敷居が低そうではありますが、それでも茨の道ではあります。

逆に言えば証拠らしい証拠を出せないのが生成AIなのかもしれません。

裏はブラックボックスなので……。仮に問い合わせて計算データ云々を入手できたとしても数値の羅列でしょうし。

現状では、生成AIの成果物は盗作疑惑が永遠に付きまとう、という認識にしかなりえないと思います。

盗作でない証明も、盗作である照明もできない。

盗作じゃないって証明でないならいいじゃーんって開き直る人がいそうですが、グレーゾーンって喜んでいいのかなあ……。

別の世界線を覗きたい

話を最初に戻します。

「高精度なAIには大量の学習データが不可欠だから、権利問題をクリアしても未来はなさそう」です。

データがたくさんあればAIという技術の発展が見込めるけれど、それには権利の問題が立ちふさがる。

仮にそれが権利者の権利を守る段階に来たらAIの発展は終わる。

でも、現状の生成AIの成果物は権利侵害をしているともしていないとも言い切れないのでは？

そう思っています。

NFTがいい例ですが、著作権を持っていたとしても物理的には何の意味もありません。

権利持っている人以外スクショできる機能なんてスマホにはありませんし。

ていうか、権利云々て性善説のもとに成り立つものですよね。

もはやBIOに「AI 学習禁止」なんて書く時代は遅いです。

絵を描いたのならばAI 学習疎外ツールを使って自己防衛する時代になっています。

文章の場合は防ぎようがありませんが……いやあるのか？　

正直、盗作盗作いう人たちの決めつけ発言に辟易しますが、グレーゾーンであることは変わりませんし、この先白か黒かに変わることもないと思います。

そうです、私はAIという技術が気になっているだけあって、生成AI 技術＝盗作ツールというレッテルが貼られるのが嫌だなあと思ってるだけです。

今現在は否定できる証拠もないので、断言はできないでしょ！　としか言えないのですが。

AIがうまーく発展してる未来のフィクションはどうやって高精度で大容量なデータットの獲得と権利問題を解決したのでしょう。

フィクションに聞いてもわかりませんね。

今の環境は頭打ちなのでは

そうそう思い出した。

DXが進んだのはコロナの影響という話を以前聞いたんです。

企業がちまちまやっている業務効率化や働き方改革なんてちっとも効果がなくて、COVID19が一番の功績者だったと。

その部分はただの皮肉でしたが、事実でもあるので、人間って環境が変わるとそれに対応していくんだなあとつくづく感じました。

とはいえ、今回話題にしている生成AIはおよそ画像生成AIのことを指しているので、環境変化によって必要に迫られることはないと思います。

娯楽の域を出ない生成AIの未来もさして思い浮かびません。

何に使うんだろう。

気にはなってるけど傍観者なもんで……。

なんかこう、心理学に似てるような……一般人は何に使うんだろうってなる……専門家は分かってそう……。

おしまい

技術の発展って難しいですね。

ペンタブで描いたものよりアナログの絵が賞賛されたように、ハイテクはすごい、という先入観があるのかもしれません。

すごいからずるい、になるんでしょうね。

障害があって絵が描けない人が生成AIで絵を出せるようになったという話を見たとき、そういう人もいるのかと感心しました。

乱数要素も絡むため、著作物であると主張できるかはさておいて、想像したものを出力できるのは楽しいと思います。

……使ったことないですけど。

Permalink | 記事への反応(1) | 12:55

「機械学習」を含む日記

■NVIDIAとAIの小史

■[ゲーム日記]２月２０日

■生成AIの前に機械学習ブームがあったじゃん？

■小学館に何か言えっつっても無理じゃないかな（追記した）

「小学館は、クリエイターの著作者人格権を最大限に尊重する。

そして、取引先企業にも同等の尊重を求める」

■ワクチンツイート分析における「ワクチン賛成派」とは誰か

解答

まとめ(および私見)

分類方法

その他雑な所見

参考文献

■すべてがAIになる

■生成AI推進派も反対派も「議論する以前の状況」を脱しよう

AIによる学習を阻害する技術に対する法的措置の可能性

AIイラストに規制を求める団体理事の不祥事について

一次創作物の二次利用に関するガイドラインの一例と、二次創作による収入について

そのほか

■一人のAI規制派(ようは反AI)として、SNSの思想家気取りの反AI勢に思う事

前書き「害悪でしかないからマジでやめろ」

(注意：以降「イラストレータ」という単語はこの文章では、「同人コンテンツでお金を稼いでる＋SNSで積極的に活動してるイラストレータ」のみを指します。そうじゃないイラストレータはこの文章の対象じゃないです)

1.今(2024/1/25)どういう状況なのか

2.反AI勢力は何に失敗したのか

端的に言えば「著作権、意匠権で戦おうとしたこと」に尽きる

3.「プロのイラストレータ」と「クリエイター的な道徳や倫理観、知識の高さ」が相関しない理由。あるいは一般人未満の遵法意識しか持たないわけ

散々著作権を軽視して無法地帯になったイラスト界隈を自分たちが作ったのに、なに「思想家」ぶって人に説教してるわけ？

4.どうあるべきだったか、どう祈るべきだったか

端的に言えば「一般人を見下した態度を取るべきではなかった」これに尽きる

あなたたちも変わるべきだ

追記「自分語り、読まなくてもいいです」

■機械学習予防が…… 犯罪？

■オナサポAI はての

■生成AIのこと

最初に

盗作ツールとして名高いらしい

データが多いほど幸せになれるかも

どこから盗作になるのか

別の世界線を覗きたい

今の環境は頭打ちなのでは

AI イラストに規制を求める団体理事の不祥事について

■一人のAI 規制派(ようは反AI)として、SNSの思想家気取りの反AI勢に思う事

2.反AI 勢力は何に失敗したのか