「Danbooru」を含む日記

はてなキーワード: Danbooruとは

2024-11-18

■

danbooruの名前はよく出てくるけどyande.reはいまいち出てこないのが不思議

Permalink | 記事への反応(0) | 20:24

2024-11-16

■Xはイラストの学習なんてしていない

Xが学習に使いたいのはテキストの方

そもそもの話、X社は画像生成AIなど作っていない。彼らがつくっているのは検索支援 AI Grok。学習に使いたいのはテキストの方であって画像ではない。

Grokとは

わかりやすさのために ChatGPTと比較してみる。2023年にリリースされた GPT-4 に試しに今期のアニメについて質問してみよう。

今期最も人気のアニメはなんですか？
ChatGPT:
2024年の今期で人気のアニメはいくつかありますが、「進撃の巨人」や「呪術廻戦」が特に注目を集めています。また、新作では「東京リベンジャーズ」や「スパイファミリー」も話題です。どの作品に興味がありますか？

アニメに詳しい人ならちょっと古い話をしているのがわかるだろう。 GPT-4 が学習を行なったのは2023年までの情報だ。なので最新の話題に対応できないのである。

一方、Grok は Xの投稿をリアルタイムに検索して反映する。もし Grok で同じ質問をすればダンダダンやリゼロ、ブリーチ辺りの話をするはずだ。つまり、Xが収集したいのは「ダンダダンの７話泣かされたわ・・・」みたいな投稿のことであってイラストではない。

Grokの画像生成機能は何か？

Grokには画像生成機能がついているが、これは自前の物ではなく Black Forest Labs社の FLUX.1 というモデルである。X社が Xに投稿されたイラストを収集して学習させているわけではないのだ。それでは FLUX.1 の訓練に使ったのはどこの画像なのだろうか？データセットは明らかにされていないが十中八九使っていそうなのが LAION-5B である

LAIONとは

現在大手の企業は「著作権的にクリーンな」画像生成AIをつくっているが実際には版権物が出てくることが知られている。なぜそんなことが起こるのだろうか？

このからくりは LAION のデータセットにある。LAIONはドイツにある非営利組織。ネット上のありとあらゆる画像を収集しタグをつけたデータセットを公開している。

LAIONのFAQ　からの引用：

Q. 私の著作物があるのでデータセットから除いてください
A. LAIONは非営利の研究組織です。ドイツの著作権法（§60d UrhG）に従いあらゆる著作物の利用が許されています。

とあるようにドイツの法律上合法である。実際に訴えられた後LAION側が勝訴している。とはいえこの組織にはAI 関連企業からの多額の寄付金があることが知られており、パチンコ３店方式のような意味合いでの合法とも言える。

尚、反AIさんと反々AIさんが著作権法第30条の4を巡って喧嘩をしていますが、世界では日本の法律は関係ないです。いちおう念の為。

反AIのGlazeの使い方は間違っている

反AIさんが迷惑な暴れ方をしている。

他の絵師さんに Glaze を使うように詰め寄ったり、使わないやつはAIに加担していると攻撃したり。挙げ句の果てには「自分の絵にGrazeをかけました」と宣言したり。

もう、全てが間違っている

そもそも、Glaze も Nightshade もAI 学習を阻害するものではない。学習したモデルをぶっ壊す毒なのである（poisoned って書いてあるでしょう？！）

相手に食わせなければ意味がないんだ。Glazeかけたとか自分で言うな。対策されるでしょう？（後述）

それと他の人に強要する意味はない。使いたい人が使えば十分なんだ。

事実すでに効果は上がっていてOpenAIは悲鳴をあげ対策を急いでいる。

Glaze/Nightshade とは

反AIさんの考えるよりも Glaze/Nightshade はずっと強力だ。それはデータセットを汚染する攻撃である。簡単に言えば Nightshadeは「学習中に他の絵に変換されてしまう」ノイズをかける。この操作を毒入り（poisoned)と呼ぶ。ピクセル毎の微小な変更なので Nightshade をかけた後もイラストはぱっと見はかわらない。

Nightshadeを使って例えば犬の画像を猫の画像になるノイズをかけたとする。するとAIは犬と猫が混ざったまま学習を進め「犬」と言う概念が無茶苦茶になってしまう。

図：毒入りモデルの変化　　(arXiv:2310.13828から引用)

上の図は毒入りの画像を２００枚食わせたときの変化の様子だ。犬が猫になってしまっている。それだけではなく”犬”に近い概念、”子犬”、”ハスキー”、”狼”もぐちゃぐちゃになっている。

図：毒入り枚数による変化　　（同引用）

こちらは50、100、300、と毒入り枚数を変化させたときの様子。50枚の時点ですでにめちゃくちゃになっている。

余談０

XでAI(Grok)の学習に使って欲しくない人は

設定とプライバシー→プライバシーと安全→Grok　

から学習許可のチェックを外すと良い

余談１

もし私が反AIだったなら、イラストに Nightshadeをかけて danbooru に投稿するだろう。二次元イラスト特化の画像生成AIはdanbooru2021/ danbooru2022 などのデータセットを使っているものと見られる。これらはイラスト投稿サイトdanbooru から収集したものである。

余談2

ところで Glaze も Nightshade もその内部で画像生成AIを使っているということを知ったら反AIさんはどんな顔をするだろう？

Glaze は特徴量抽出を行う。おそらく Stable Diffusion の VAE（Variational Autoencoder）を使っている。そしてNightshade の方も内部ではStable Diffusion 等の画像生成モデルを用いて別の画像を生成する。

余談3

Glaze が機能しない？あるいは解毒方法が見つかったかもしれない

we_need_to_talk_a_little_bit_about_glaze_and

上のスレッドのコメント欄では Glaze が論文のようには機能しないことについて議論され「画像のリサイズをしたのではないか」と予想している。Glazeをかけた後に画像を縮小、データが圧縮されてノイズ効果が消えたのではないかということだ。

A) 絵師さんが Glaze をかけたあと画像を縮小した可能性

B) 画像サイズやファイルタイプによってはプラットフォーム側が勝手に加工をする

C) 学習の際にリサイズを行う (Stable Difusion XL では1024px, 古いモデルは512px)

A,B については絵師さん側に知識があれば対処可能だけれども C の方はなんともし難い。小さい画像を投稿したところで [縮小→拡大] でノイズは落とせそうだ（解像度は悪くなるだろうが）

尚、上の議論に関しては誰も検証をしていないので注意。

余談４

LAIONは収集画像そのものを所有せず、データセットはウェブ上にある画像のurlとタグをまとめた物であるらしい。

ということは、LAIONの新しいデータセットが公開されたタイミングで画像のurlを変更すれば学習に使われることを回避できそうだ。特に、個人サイト／ブログの所有者ならば古い url に●んこ画像でも差し替えておけば嫌がらせになる。（タグ差し替えはこのグラフの Simple Attak に相当）

90年代においては画像に直リンクされたときの報復としてうん●画像に差し替えたものです。まさか令和になっても有効とはね

余談５

この記事をぼちぼち書いているいるうちに2日が経過した。今、私のXのタイムラインもおすすめもとても静かだ。攻撃的な人たちやデマに流されやすい人達は皆どこかに行ってしまったようだ。残ったのはこれまで静かにイラストを描き続けてきた人たちでとても穏やかな空気が流れている。ずっとこのままがいい。

Permalink | 記事への反応(1) | 21:21

2024-11-15

■anond:20241115170719

聞いてみた。

Danbooruがタグ荒らしに対抗して新規のタグの登録を停止した場合、画像生成AIの学習に影響はありますか？

Danbooruがタグ荒らしに対抗するために新規タグの登録を停止した場合、画像生成AIの学習にいくつかの影響が考えられますが、特に以下の点で学習や生成に影響が出る可能性があります。
　
1. 新しいコンテンツやトレンドの反映が遅れる
新規タグの追加が停止されると、新しいキャラクターやトレンドに関連するタグが登録されないため、最新のコンテンツに対応できなくなります。特に、人気のアニメやゲームが登場した際に、関連するタグが登録されないと、それに基づく画像生成モデルの学習が行えず、最新トレンドのキャラクターやシチュエーションの生成が難しくなります。
　
2. モデルの多様性が失われる可能性
既存のタグのみで運用を続けると、同じタグが繰り返し使われるようになり、データの多様性が減少します。この結果、画像生成AIは一部のテーマやスタイルに偏りやすくなり、学習データのバリエーションが乏しくなる可能性があります。例えば、「夏のシーン」や「ハロウィン」などの季節限定のテーマや、新規のアートスタイルに対応するタグが欠如することで、生成画像に多様性が不足しやすくなります。
　
3. 既存タグの過負荷
新規タグを作成できない場合、似たテーマや特徴を持つ画像が既存のタグに集中する可能性があり、既存タグの意味が曖昧化し、データの品質が低下する可能性があります。たとえば、新規キャラクターが増えた場合でも、それに対する適切なタグが登録されないため、類似キャラクターに関連するタグに無理やり分類されることが起こり得ます。これにより、画像生成AIがキャラクターの特徴を正確に学習できず、生成結果に混乱が生じやすくなります。
　
4. タグの細分化が困難に
タグが新規に追加できないと、キャラクターの詳細な設定や特定のシチュエーションに対するラベルが不足し、タグの細分化が進まなくなります。たとえば、「笑顔のキャラクター」と「怒っているキャラクター」を区別する新しいタグが追加されないと、感情表現のバリエーションが不足し、AIが生成する画像の感情表現が単調になりがちです。
　
5. モデルのリファインが難しくなる
生成AIの改善やリファインには、タグの精度や多様性が重要です。新規タグの登録が停止されると、生成AIを精度良く改良するための情報が制限され、モデルの改善が遅れる可能性があります。また、タグの種類が限られることで、学習の進捗や再トレーニングの際の効果も限定的になり、モデル全体のパフォーマンスに影響が出ます。
　
6. タグ荒らしの防止効果はあるが、モデル開発には一長一短
新規タグの登録停止はタグ荒らし対策としては効果が見込まれますが、同時に学習データとしての価値も低下させるリスクがあります。荒らしのリスクが減少する一方で、最新データへの対応が困難になり、学習データとしての柔軟性が損なわれるため、画像生成AIが最新のスタイルやコンテンツを再現する能力が低下します。
　
結論
新規タグの登録停止は、タグ荒らし防止には一定の効果を持つものの、画像生成AIの学習には制約がかかるため、生成画像の多様性や精度に悪影響を及ぼす可能性があります。

Permalink | 記事への反応(0) | 17:15

■ChatGPTに画像の無断学習の対応策を聞いてみた

AIにAIへの対抗策を聞くってSFっぽくて楽しい。

ChatGPTは嘘もつくので、あくまで参考程度に。

・画像を生成するAIに対する対抗手段を教えてください。

画像を生成するAIによる無断学習や利用を防ぐために、以下のような対抗手段を講じることが可能です。
　
1.透かし（ウォーターマーク）の埋め込み:
画像に目に見えるまたは見えない透かしを入れることで、無断利用や生成AIの学習に対して抑止効果を期待できます。特に、目に見えない形で画像データに暗号的な透かしを埋め込む「デジタル透かし」技術が有効です。
　
2.メタデータの埋め込みとロボット排除設定:
画像データに著作権情報や「AIによる無断学習を禁止する」といったメタデータを埋め込み、ウェブサイトには robots.txt ファイルで画像クローラーのアクセスをブロックする設定を追加します。これにより、クローリングや収集の抑制が期待できます。
　
3.ステガノグラフィ技術の利用:
ステガノグラフィを用いて、画像に気づかれにくい形で識別情報を隠すこともできます。これにより、画像の流出経路や利用先を追跡でき、無断利用の発見に役立てることができます。
　
4.法的な警告表示や利用ポリシーの明示:
ウェブサイトや画像の配布先に、AIによる無断利用や学習を禁止する旨の法的警告や利用ポリシーを明示することも有効です。利用条件をはっきりと示すことで、AI 企業や研究者が慎重になる可能性が高まります。
　
5.画像認証技術の導入:
AIが利用しにくいように、画像に人間には気づきにくいパターンやノイズを挿入する技術もあります。たとえば、AIにはノイズとして認識されるが、人間には問題なく見える小さな変形やカラーパターンを追加することで、AIによるデータ学習が困難になる場合があります。
　
これらの対策は、画像生成AIに対する防御としては有効ですが、100%無断利用を防げるわけではありません

・生成AIの学習を混乱させる手段はありませんか？

生成AIの学習を混乱させるための手段には、以下のような方法が考えられます。
　
1.ノイズや歪みの追加:
画像に目立たない程度のノイズや歪みを加えることで、アノテーションモデルが境界や特徴を正確に認識しにくくする手法です。たとえば、ピクセルレベルでランダムなノイズを追加する、わずかに画像をぼかす、あるいは境界線付近に小さな変化を加えるといった手法が有効です。
　
2.不規則な輪郭の挿入:
アノテーション処理は、対象物の輪郭や特徴を正確に捉えることが重要です。そのため、背景や対象物の輪郭にわずかな不規則性を加えることで、アノテーションツールが対象物の境界を正確に判断しにくくすることができます。たとえば、背景に模様や偽の輪郭を挿入する方法です。
　
3.テキストやラベルを埋め込む:
画像に人間には視認しづらい形でテキストやラベルを埋め込むと、AIのアノテーションプロセスが混乱する場合があります。これにより、AIが意図しない領域を注視することがあり、誤認識を誘発します。
　
4.色や明るさのランダム変化:
画像の色や明るさを部分的に変化させ、一定のパターンを持たないようにすることもアノテーション処理の混乱を招く一手です。これは、オブジェクトの検出や認識が色や明暗の差異に依存している場合に有効です。
　
5.擬似的なオブジェクトの追加:
画像内に小さな擬似的なオブジェクトや模様を追加することで、AIがそれらを誤って主要なオブジェクトと認識し、アノテーション精度が低下する可能性があります。特に、背景に似たオブジェクトを散りばめることで、AIはどの部分が対象なのか判断しにくくなります。
　
6.アドバーサリアル技術の活用:
AIの認識を誤らせるために用いられる「アドバーサリアル（敵対的）な例」を使う方法もあります。特定のピクセルパターンや色の配列を配置することで、AIのアノテーションが意図的に誤作動するよう誘導できます。この技術は深層学習モデルに対して特に効果があります。
　
7.カモフラージュテクニック:
画像全体にわずかなカモフラージュパターンを重ねることで、AIの認識を混乱させる方法です。この手法では、人間が見た場合には問題なく認識できるものの、AIが対象を捉える際に誤って検出するようなパターンを画像に追加します。

・思考実験として、danbooruなどアノテーションの元データとして使われているサイトのタグが荒られたら画像生成AIのモデル作成にダメージはありますか？

思考実験として、Danbooruといったアノテーション元データのタグが荒らされた場合、画像生成AIのモデル作成に与える影響は以下の通りです。
　
1. データの品質が低下する
Danbooruは、イラストや画像に対して詳細なタグが付与されており、これらのタグ情報は画像生成AIの学習にとって非常に重要です。タグが荒らされることで、画像とタグの対応関係が崩れ、モデルが正確な特徴を捉えにくくなるため、生成精度が低下します。
例えば、特定のキャラクターやテーマに関連するタグが荒らされ、誤った内容のタグが付与されると、モデルはその誤った情報を学習し、キャラクターの特徴や設定が再現されにくくなる可能性があります。
　
2. ノイズデータの影響
タグが荒らされると、モデルの訓練にノイズデータが増えるため、学習効率が悪化します。たとえば、「黒髪」のタグが誤って「金髪」などに変更された場合、モデルは同じ画像に対して異なる特徴を学習することになり、結果として生成画像の一貫性が失われることが考えられます。
また、同じ画像に異なるタグが付与されることで、モデルが過学習や誤学習を引き起こし、生成された画像が本来の意図からかけ離れたものになる可能性もあります。
　
3. キャラクターやスタイルの再現性が低下する
Danbooruでは、特定のキャラクターやアートスタイルを識別するタグが多く存在します。これらが荒らされると、特定のキャラクターやスタイルのデータが混乱し、モデルが正確にキャラクターの特徴を把握できなくなるため、ユーザーが期待する生成結果が得られにくくなります。
例えば、あるキャラクターのタグが「髪型」「服装」「色彩」などで荒らされると、そのキャラクターの再現が曖昧になり、モデルが正しいビジュアルを生成できなくなることがあります。
　
4. タグの信頼性低下によるモデルの不安定化
タグが荒らされると、データセット全体の信頼性が低下します。信頼性の低いデータをもとに学習したモデルは、特定の条件で異常な出力を生成することが多くなり、モデル全体の品質が低下します。これは、生成AIが学習中に「どの情報を信頼すべきか」を判断できなくなるため、生成結果が不安定になったり、多様性が失われたりすることが考えられます。
　
5. 検索やフィルタリング精度の低下
AI モデルを利用するユーザーは、タグを通じて希望する画像を生成したり、条件に合った画像を探します。タグが荒らされると、AI モデルの検索・フィルタリング機能の精度も低下し、生成プロンプトが期待通りに機能しなくなる可能性があります。たとえば、「風景」タグが荒らされ、異なるジャンルの画像が混入するようになると、風景画像を生成したいユーザーの要求が満たされにくくなります。
　
結論
Danbooruなどのタグが大規模に荒らされた場合、生成AI モデルの精度低下や一貫性の欠如が発生しやすくなり、特にキャラクターや特定のスタイルに依存する画像生成モデルに大きなダメージを与える可能性が高いです。

すでに学習済みのモデルを使って汚染されたデータのクレンジングや異常値検出を行うなど対策される可能性がありますが、それらを阻害する手段はありますか？

無断での学習を妨害し、学習コストを増加させるために、上記の方法を阻害する手法には以下のようなアイデアがあります。これらの手法は、意図的にデータセットの品質や一貫性を崩すことで、学習モデルの精度を低下させ、データクレンジングや異常値検出のプロセスを複雑化することが目的です。
　
1. 偽タグやノイズタグを大量に追加する
意図的に誤ったタグや無関係なタグを画像データに付与し、データセットの信頼性を低下させます。これにより、転移学習やラベルノイズ検出が困難になり、正確な特徴量を学習するコストが増加します。
例えば、キャラクター画像に全く無関係なタグ（「動物」や「風景」など）を追加することで、モデルがどのタグが信頼できるか判別しにくくなり、誤ったラベルがノイズとして学習されるリスクが増えます。
　
2. 特徴量をぼかす／微妙な変更を加える
特徴量ベースのクレンジングや類似度分析に影響を与えるため、画像の特徴がわずかに異なるように加工を施します。具体的には、色調を微妙に変える、ランダムなピクセルの位置でノイズを追加する、または特定の部位を意図的にぼかすことで、モデルが抽出する特徴量の安定性を低下させます。
この方法により、同じキャラクターやスタイルであっても類似度分析が困難になり、正確なクレンジングが行いにくくなるため、データ処理のコストが増加します。
　
3. アノマリーに近いデータを意図的に増やす
特徴が異なるバリエーションや擬似的な異常データを大量に追加することで、異常検出アルゴリズムの信頼性を下げます。たとえば、キャラクターのデザインや背景を少しずつ変えた画像を意図的に作成することで、異常値検出が頻繁に誤検出されるようにします。
こうしたデータが混在することで、オートエンコーダーやアンサンブルモデルを使った異常検出が混乱し、正確な異常サンプルの抽出が困難になります。
　
4. 高頻度で微小なラベル変更を行う
学習済みモデルの転移学習やラベルノイズ検出を阻害するために、同じ画像に対してラベルを定期的に変える手法です。微小な変更を行うことで、モデルは正しいラベルを安定的に学習することが難しくなり、モデルの信頼性が低下します。
例えば、ラベル「黒髪」を「暗めの髪」や「濃い色の髪」などに頻繁に切り替えることで、学習に不確実性を持ち込むことが可能です。
　
5. 意図的に類似画像を多重登録する
データセット内で非常に類似した画像を複数の異なるタグで登録することで、モデルの学習を混乱させます。特定のキャラクター画像を少しずつ変化させて複数のタグを付けると、モデルは「どのタグがどの特徴に対応しているのか」を判別しにくくなり、データセットのクレンジングが複雑化します。
特に、タグの一貫性が失われるため、類似度分析やアンサンブルモデルによる異常検出の効果を低下させることが期待できます。
　
6. アドバーサリアルノイズの付与
AI モデルが認識を混乱させるように、アドバーサリアルノイズ（敵対的な例）を追加します。人間にはほとんど気づかれないレベルのノイズを画像に追加し、モデルが特定の特徴を正確に認識できないようにすることができます。
このノイズにより、モデルの特徴量ベースの学習が混乱し、意図した通りに学習できないため、クレンジングの精度も低下し、データ処理の手間が増加します。
　
7. 乱数ベースの偽ラベル生成
特定のルールではなくランダムにタグをつけたり、特定のカテゴリ間でランダムにラベルを入れ替える方法です。これにより、ラベルと画像の関連性が薄れ、アノテーションの一貫性が失われます。この乱数による偽ラベルの付与は、ラベルノイズ検出やアノマリー検出において、真のラベルを見極めるコストを大幅に増加させます。
　
まとめ
これらの手法は、AIの学習やクレンジングを意図的に妨害し、無断学習にかかるコストを増加させるために有効です。特に、「微小な変更」や「アドバーサリアルノイズの付与」といった手法は、見た目の品質に影響を与えずにモデルにノイズを持ち込むため、非常に効果的です。

Permalink | 記事への反応(1) | 17:00

■anond:20241115003855

そら個人を付け狙われたら無理よ

というか、特定個人狙い撃ちであれば法律でどうにかできそうな雰囲気あるしな　判例はまだないけど

それより、danbooruの画像全部ぶっこぬきみたいな場に混ざっちゃうのを避けたいんじゃないかなって思ってるし、それなら納得できる

Permalink | 記事への反応(0) | 00:42

2024-11-13

■

絵師がdanbooruばかり槍玉に挙げてるのは何でなんだろ

そもそもこのサイトはbooru系のサイトの一つで、他にもbooruサイトは沢山ある（例:gelbooru）

danbooruはbooru系列の中でもまともなサイトで作者名と引用元は必ず明記されてる、Pinterestよりよっぽど厳格

更にDMCAにも対応する上にサイト独自の除外申請も出来る（対応しないと騒いでる人もいるが書式が整ってないだけ、毎日のように申請は通ってる）

まぁAIに使われると勘違いしてるんだろうが、ネットに上げた時点でAIには使われてる

タグ付けも今では専用AIがあるのでdanbooruは必要とされてない

というかそもそも danbooruはAI イラストに賛同していない

要するに事実はどうでも良くて、架空の安心感が得られるなら何でもいいんだろうなぁ

Permalink | 記事への反応(1) | 18:47

2024-11-11

■anond:20241111153918

Danbooruとかでそのまま使えるんだな、勉強が足りなかった、ありがとう…😟

Permalink | 記事への反応(1) | 16:00

■

もしかしてインターネットを知らないのかもしれない

Permalink | 記事への反応(2) | 14:53

2024-10-23

■Danbooruがイラストを消してくれない

DMCA 申請フォームから何度も申請を出しているのに全く消さない。

自分の申請文が変なのかと思い、人に相談しながら内容を精査して削除を試しているが、そもそも添えたURL（証拠データをアップした場所へのリンク）へのアクセス履歴がついていないので、見て貰えているのかすら分からない。

本名、メアド、住所（号室まで書いた）、電話番号、転載先、転載元のURL（数十点）、証拠データへのリンクに署名、

全て書いているのに、そもそも向こうが証拠を閲覧しようとすらしていないのではどうしようもない。

最初のうちの申請文はシンプルだったが、修正や説明を加えて何度も削除を頼んでいるので、作者本人なのに迷惑ユーザーか虚偽の申請をしてきた人か何かだと思われてしまっているのだろうか。

Danbooru側が私自身を信用していないのであれば弁護士に代行してもらうしかないと思って、今は代理人になってくれる弁護士を探しているところだ。

今は絵描きからのDMCA 申請も殺到しているだろうし、嫌々削除対応してちょっとでも面倒くさそうな絵描きは無視してるんだろうな。迷惑だから早くサイトごとなくなってほしい。

あんなサイトありがたがってるユーザーも、Danbooruを餌にしてAIに食わせてるユーザーもみんなクズ。

Permalink | 記事への反応(0) | 20:10

2024-08-02

■画像へのタグのつけ方に表れるフェチズム

そのフェチズムに無理解な人たちは、タグをつけない。

たとえばdanbooruでなら百万単位でヒットするくらいメジャーな身体の部位についてのタグがあるのだけど、女性人気のジャンルでは該当する画像にもほとんどタグがつけられていない。

おそらく、このフェチズムを理解するのは男性ばかりなのだろう。

そのフェチズムが共有されすぎているがゆえに無自覚な人たちは、タグをつけない。

同じくdanbooruでは数十万単位でヒットするようなメジャーなタグがあり、日本人が描く画像はかなりの割合で該当するのだけれど、日本人はそのタグをほとんどつけない。

他方、たとえば日本の作品の該当するキャラ（非常に多くが該当する。）を外国人が描いた画像の場合には、ほぼ確実にこのタグがつけられている。

おそらく、日本人以外からは「日本人は○○フェチだ」と思われているが、我々は無自覚なのだろう。

（蛇足だが、自分の知る限り、「日本人はかわいいと言うが現地ではそうでもない外国人女子」はだいたいこのタグがヒットするタイプ。

　オフラインの知り合いに聞いた限りでは、この属性は欧米ではネガティブに捉えられている。）

このような傾向を踏まえた上で、国や集団ごとの好みの傾向を定量的に把握したい、と思っている。

「肌が綺麗」のようなどの国でも肯定的に評価される属性に対する地域ごとのウェイトの違いであれば、より容易に検証できるだろうが、そうではなく、「A国では減点要因だけどB国では加点要因」のようなはっきりと好みの分かれる属性を調べ上げたい。

Permalink | 記事への反応(1) | 13:31

2024-07-22

■

データセットがMITやCC0で配布されているからといって、その中にある著作権で保護された個別のデータまで、データセットのライセンスが適用されるわけではない。

たとえば、danbooru データセットがCC0ライセンスで配布されているからといって、その中にあるイラストを個別に再配布・商用利用するようなことはできない。

これを直感的に理解できない人間は、独創的な理論をベースとした反AIになりやすいようだ。

Permalink | 記事への反応(0) | 13:40

2024-07-19

■

昔絵描きだったが最近は長いこと絵を描いてなかった、でもAIのおかげでオタ趣味に復帰できた気がするのでAIにはちょっと感謝している。

＜誰？＞

昔々一度だけPixivでデイリー1位を取ったことがある。ほんとにまぐれ。
一応Danbooruにも名前がある。ロリエロとか消されているのでもう半分くらいしか残っていないけど。
絵で収入を得たことはない。手が遅い上に自分が興味のあるものしか描かなかったので。
なので「絵師」と呼ばれるものの入り口にもたどり着かなかった存在という感じ。

＜なぜ描かなくなった＞

家族に絵描き趣味を隠していて、なおかつ現在自分の部屋がないため。部屋があれば今でもこっそり描いてたかも。
仕事のクレーム電話対応中に手元ではガンダム描いてたりはする、でも女の子を描くのはムリ。
アマプラに入っていてもお急ぎ便が使えないくらいの田舎で、周囲にオタ友達はいない。

＜そもそもオタ趣味とは？＞

親やクラスメイトに言っても賛同を得られないばかりかバカにされてしまいそうなものが好きで、でも好きだという気持ちが諦めきれず、ネットの向こうに「俺はこういうの好きだけどおたくらどう？」と声をかけ、「俺もだよ」と匿名ででも肯定してくれる人がいれば、自分の中にいる「俺にはこれからもずっと心からわかり合える友達なんてできないんだ」とひとりぼっちの青春を過ごした少年が少し喜ぶ。というもの。
そもそも「お宅」という少し距離を取った二人称は、今話しかけている相手は自分とは違う別の人間なのだからもしかしたら全く解り合えないかもしれない、でもそれは尊重するしかない。というちょっと相手に対して腰が引けた態度が選ばせた言葉なんじゃないかな。

＜AIに手を出してどう変わった＞

単純に「俺はこういうの好き！」が非常にやりやすくなった。英語打ち込むだけで簡単に出したいキャラのエロ絵が出てくるもんね、AI様々。急にドラえもんのひみつ道具が実現した未来にきたみたい。
昼休み中にも次はどういう要素を入れようか…こういうポーズは作れるのか…と昔好きだったキャラたちのことを思い浮かべて構図を練ってたりする。忘れてたこういう感覚。
自分が参加している界隈はかなりおっさんだらけで古いキャラでも結構反応がある。なんあらすでに鬼籍に入られている作家さんの作品を作り続けてる人もいてある種の執念を感じる。
一応自分で描いた落書き（スマホに指で描いたようなやつ）を元にしたAI絵も作ってみるけど、貼るときは「自分は絵も描けるんだ」みたいな態度は絶対に匂わせないようにしている。トラブルしか生むまい、身バレ怖い。隠さない人もいるけど。
というわけでこれまでずっと見る専だったのが、最近は絵を貼る側として参加できるようになった。のめり込みすぎて家族に最近スマホいじりすぎだと怒られてるので少し冷静にならなければと思うくらい。でも楽しい。

＜著作権侵害とか＞

そもそも俺は、商業漫画やアニメのまったく性的なこととは関係ない女の子のおっぱい出したりパンツ脱がしたりしてたわけで、著作権者の皆様方にはどうかバレないでください。バレてもどうか気づかないフリをしていただけないでしょうか。という思いしかない。
あと元々無断転載・無断改変当たり前な文化のところに入り浸ってたので、そういうのも気にならない。むしろ俺の絵を転載したり、絵柄を模倣した絵を見かけたら嬉しいかも。
昔々、匿名画像掲示板に女の子のお風呂シーンを描いて貼ったら女型モンスターの脱皮シーンにコラ改変されたときもまあまあ笑ったよ。Danbooruで「このキャラはよく知らないけど○○（同じ髪型の有名ラノベキャラ）の幼少期だと思えば使えるぜ」と英語のコメントつけてた外人も許そう。今はその絵もコメントごと消されてしまったので俺の思い出の中にしかいないけれども。
「無断学習」という言葉もね、自分も作家さんの同人誌・画集・エロゲ原画集とか買ったけど、「この人の技術を少しでも盗んでやろう」という気持ちが7割くらいだった。

＜絵師の特権とは＞

正直絵を描くことを趣味としていたおかげでネット上でちょっと特別扱いされてたとは感じる。
「これが好き！」というのを言葉で表現すると普通に警察呼ばれそうな嗜好でも、それを絵で表現すると「神！」「素晴らしい作品です！」「ずっとその作品のファンでいて！」と反応が違うからね。こっちは実益（ズリネタ）を与えてるので対価をもらっているようなもんではある。
AIでそれがなくなったか？と言われると、まだまだ手書きの方がずっと強いと感じる。自分の絵に関して言うと昔々の本当につたない初期の絵ですらごくごくまれにネット掲示板で見かけたりするが、AI絵はこっちがどんなに傑作だと思ってたものでも転載されてるのは見たことない。
現在のAI界隈はみんな表現者になれることに夢中で、実は他人の絵なんて流し見して保存してないのだろう。AI絵は絵の価値が非常に軽い。

＜ネットの思い出＞

思えばネットではいろんな人と交流して楽しい思い出もあればとんでもない失敗も数多くあった。その節は本当にすいませんでした、今でもたまに思い出して悲鳴を上げてます。
ネットの向こうの人というのは不思議なもので、普段から自分は病弱だ死ぬ死ぬと言っている人が十数年たってもピンピンしてたり（長生きしてください）する一方で。今まで全く弱みなんて見せてこなかった人がいつの間にか亡くなってたりする。
その亡くなった人のことを思う。現在のAI ブームまで存命だったらどうだっただろう、きっと楽しいオモチャが手に入ったと遊び倒し、いろんな可能性を試しまくってたに違いない、と勝手に考える。亡くなるのがちょっとだけ早すぎたね。
人生一寸先は分からないから「やらない理由」を考えてる時間はない、自分が今やりたいことを今やるしかないので、自分の気に入らないことをする他人がいても尊重してほしい。

Permalink | 記事への反応(0) | 03:54

2024-07-17

■なぜエロ 動画 サイトの検索 機能は、期待した動画が出にくいのか？

成人向け動画共有サイトでエロ動画を検索していても、自分が望んでいるシチュエーションのエロ動画がヒットされにくいという問題がある。(「あの恰好であの体位でしている動画が出てこない」とか。)

Danbooruなどの二次絵に特化したサイトだと、静止画という特性上、1場面しか表されていないため、的確に画の状況をタグ付けして内容の特徴を浮き彫りにしやすい。

しかしエロ動画サイトの動画となると、動画内には場面が何場面もあり、カットやシーンによって画の特徴が変わりやすいから、

もしエロ動画視聴ページでDanbooruみたいにタグ付けをやろうとすると示唆してるタグとシチュエーションがまちまちになって来たり(※)、もしあえて動画内の全特徴を列挙するとタグの数が膨大になる可能性がある。

なのでアップロードされた動画には、動画タイトルや動画説明と、タグでは演者とか主なシチュエーション(どういう設定物のAVか)とか付けられる属性や情報が少なく、ざっくりしている。

それで「検索ではそれっぽい動画の候補は出すからあとはその中から自分の目で確認して」となる。

(※どういう事かというと例えば、「トップビュー」「正常位」「騎乗位」…… というタグが付いてたとして、動画を見ると「トップビューの騎乗位と、女側視点の正常位」の内容だった。期待した「トップビューの正常位」にならない訳で。)

多分「YouTubeの検索機能がゴミ」「ニコニコ動画の検索の方が使いやすい」と言われるのは、そういう都合なのだろうと。

ニコニコ動画なら、MAD 動画とかゲーム動画とか趣旨が分かりやすい動画が多いだろうから、タグを中心とした検索がうまくいくが、

YouTubeとかになると、掴み所のないカットが多かったりする動画も割とあるわけで(日常のスナップ動画や長回しの動画とかライブ配信とか)、タグ付け的に一概には括れないのだろうと。

YouTubeの検索機能がAI的に検索結果を提示しているのは、そういう曖昧な動画にも対応できるようしたためなのだろうと。(「広告的な動画を検索結果に挟む」という商業的な都合を除く。)

ニコニコ動画にあるような趣旨が分かりやすい動画を探し求めてる利用者は、YouTubeが意図してる検索機能の目的と合ってない。

(余談だが、ネットでは「YouTubeの検索機能が使いづらい」とか目にすることがあるが、エロ動画共有サイトについてはそういう話があんまり上がって来ない印象がある。
自分はSNSをやってないし5chとか深入りしてないので、エロ動画サイトの検索機能に皆どう思っているか知らないが、皆不満に思っていないのか？)

もしこれから新たなエロ動画共有サイトができるとして、検索精度を上げていたなら、動画のチャプターごとにタグ付けができるようなサイトの作りになってるとか？。。。

自分はポルノやAVとかのエロサイトにあまり詳しくないから、過去にそういうエロ動画サイトがあったかは知らないが、そういうDanbooruみたいにタグ付けできるエロ動画共有サイトは需要はあるのかもしれないと思った。

ちなみに自分は、元々エロは二次元派(インピオ・ケモノ)であるがアラサーになり、2年前から本格的にPornhubのようなエロ動画サイトも覗くようになった程度のユーザーです。(児童ポルノ動画は見てない。)

----

1～2年かかって見つけたエロ動画

https://anond.hatelabo.jp/20240715185000

Permalink | 記事への反応(1) | 22:22

2024-07-15

■1～2年かかって見つけたエロ 動画

昨日の20時か21時台、昨日の23時～23:42、今日の02時～02:45にオナニーしてたんだけども、

21時台に、かつてから自分が追い求めていた条件にピッタリ合う三次元のエロ動画をPornhubで見つけて、その後にも同じオカズで無我夢中で一心不乱にシコったんだけども。(ちなみにオーガズムな快楽の後に、疲労感のような負荷が強く感じた。繰り返すと廃人なりそう。)

毎日毎回探していたわけではないが、オナニーをする前にしているズリネタ収集時で、気が向いた時にたまにの頻度で、その条件をエロサイトでキーワード検索していて「意外と見つからないな」を、かつてから不定期に繰り返していたが、

その条件の動画を見つけた昨日までの間どれくらい掛かったをおおよそ振り返ってみると、1～2年以上探していた事になってた。

どうして自分の求めてるシチュエーションのエロ動画が、こんなにも見つかりづらかったんだろう？と思ったんだけど、雑に単純計算をしてみた。

vaginalで、 missionary_positionで、 multiple_girlsとmultiple_boysのfoursomeで、 2 couplesで、 top_viewで、 uncensoredで、 huge_penisで、 large_breastsで、 gyaruで、黒人以外で、 ……。 (ここの行、画を思い出しながら単語の羅列を書いていて勃って来る。)

という風に条件(自分がエロ動画に求めてるシチュエーションや特徴や属性や要素)を挙げて見てみると、10個以上もこだわりがある事が分かり、

じゃあ「その条件らに全て一致して貫けれた動画を見つけれる確率ってどれくらいなのか？」とざっくり確率を求めるに、

条件一つを真偽値(有無の2パターン)とすると、2の10乗、1/1024。

そして、エロ動画サイトの検索機能は、・かなり曖昧(ニコニコ動画はともかくYouTubeよりもヒットしづらい) ・多くキーワード条件を入れられない(削り過ぎてしまう)、など都合があるので、少い条件・低精度の検索機能を使って虱潰しに片っ端からエロ動画を見ていかないといけない。

つまり最低でも1024個の候補のエロ動画の中から1つしか自分が求めてる特徴のエロ動画が出てこない。(さらに仮にその条件で確実に絞れて出てきても、内容のディティールとかピッタリ自分の好みに合うかは動画を観るまで不明。)

ようやく1/1024以上の確率で本望のエロ動画を見つけられたが、こんな事に執着するぐらいだったら性欲を捨てたい。数年後また違う性的嗜好のエロ動画を求めてエロ動画サイトを漁って時間を浪費していたくない。

そういう低確率(希少性)な快楽になる物を発見したらしたで、その後、依存症的に振り回された疲労感がセットで来る。割としんどい。まるでNuggetsのようだ。

ちなみに自分は30歳で、1週間に約2回(3日に1回)オナニーしていて、1日1時間のオナニーで1回出せば満足。(オナニーし始めた14年前から変わらない習慣。)

8割以上は、二次元派なので、AVはあまり見ない方でAVとか詳しくない。AV女優とか詳しくない。

余談:

二次元のエロ絵やエロ動画は、PixivやDanbooru系のサイトでタグ検索で手間もかからず自分の好きなエロコンテンツを見つけられるが、

三次元のポルノやAVで自分にピッタリ合うエロ動画を探すのに、なんでこんなに見つけづらいんだろう？ドンキホーテみたいにわざと物を見つけづらくしている？買い物依存的？

----

後日また書いた記事

なぜエロ動画サイトの検索機能は、期待した動画が出にくいのか？

https://anond.hatelabo.jp/20240717222222

Permalink | 記事への反応(1) | 18:50

2024-06-20

■一雑魚 絵師のai絵へのスタンス

イラスト生成aiについて、普段使っている絵のアカウントでは言うと燃えかねないのでここで吐き出し

＜お前は誰だ？＞

趣味絵師。FANBOXやskebで多少のお小遣いを頂けることもあるが企業案件の経験は無し。

基本は二次創作で活動している。R-18もたまに。

＜イラスト生成aiについて＞

自分はアナログはてんで描けず、デジタル作画ソフトが進化することである程度の絵が描けるようになった人間。

イラスト ai だってツールとして使う分には問題ないと思っているし、使えるもんなら使いたい。

仕上がったものが他人のパクリになってないのが重要なのであって、その過程って割とどうでもよいと思う。

＜無断で自分の絵を使われることについて＞

個人的には、自分が描いた絵を無断で使われることにそこまでの忌避感は無い。

画像検索で資料を探すし、気に入った絵の描き方・塗り方は参考にする。

自分の絵だけ勝手に使うなというのは道理が通らないんよね。

なので、なりすまし等の明らかに悪意を持った使い方でなければ、一度webに上げた絵はどうぞ好きにしてくれというスタンスでいる。

（danbooruは勝手に自分の絵を保存してくれるからある意味助かっている。）

ai 学習でもそれは同じ。勝手に持って行ってくれて構わない。

生成物がパクリになる？i2iで直接読み込まない限りはパクリレベルの絵は生まれないよ。

＜ai派・反ai派に言いたい事＞

ai派に対しては、成りすましとか、特定の絵師に粘着するのはやめれ。

それはaiでなくてもアウトなことだ。

後はプラットフォームのルールは守ろう。

反ai派に対しては、他人にスタンスを強制するのはやめれ。

aiを嫌うのは自由だけど、それで所構わず他人の絵にai 疑惑をかけたりするのは違うよ。

後はダブスタにはならないよう自分の行動言動には注意しておいてね。

以上、一人の雑魚絵師のスタンスでした。

Permalink | 記事への反応(0) | 10:22

2024-05-04

■イラストの画像生成AIの何がいけないのかがよくわからない

画像生成AIは何が問題なのか？というwikiを見て頭のほうにいろいろ書いてあったけどさhttps://w.atwiki.jp/genai_problem/pages/10.html#id_c770cabd

もともとネットに落ちてた画像って公開情報でしょ？それを元に学習して何が問題あるの？

もともとはんこ絵と呼ばれていたイラストを学習して新たなイラストを生成することの何が問題なのか

学習もとへの還元がない←必要ない。お前の絵の要素が俺の生成した絵に何かしらの影響与えてたとして、1ピクセルぐらいのもんだろ。これ百歩譲って画像生成AIが何かしらのコラージュを作るような機械だった場合の話であって、そもそもコラージュを作る機械ではない

学習元が作った成果物によって、学習元の市場と競合する存在になりえる。←知らん。そもそも1ピクセルで大げさに騒ぎすぎ。こういう「我々は被害にあった、犠牲になった」みたいな大げさな態度とるくせに自分はちゃっかり二次創作で他人の著作権侵害して金もらってるそのダブスタどうにかしろ

学習元の模倣による類似品が容易に製作できる。←知らん。個別に現行の著作権法で対応すればいい。念のために言っておくが画風や絵柄に著作権はない

生成スピードが早く、類似品を出すことが容易なため、表現の陳腐化も早い。←知らん。どうでもいい

生成スピードが早いために、プラットフォームへの投稿速度、量ともに尋常ではない。←ま、ちょっとわかる。けど、マスピ顔も過去のものとなり客にも「結局抜ければ何でもいい」と言われ始めているし、今後質が上がるのならそもそも別に悪いこととは思わない。後はプラットフォームの運営の考え方次第

i2iやControlNetをはじめとする技術によって、盗作が容易であるとともに証明する事が困難。←画風や絵柄に著作権がない上で何をもって盗作と認定しているのか。フェミ同様推定無罪の考え方を放棄しているように見える

とりあえずざっくり大見出しだけ論破した。その他「どうでもいい」だけじゃ足りなさそうな小見出しを論破していく

生産者減少に伴う産業の衰退←Xでは画像を学習させると明言しているにもかかわらず今でも普通に絵が流れてくる。俺は結局絵を描くことが好きな奴は絵を描くことをやめれないんだと思うよ。描いて、それを人に見せたいから学習されると知りながらもネットに上げる。「絵を描いてちやほやされたい」だけの人は筆を折るだろうが、「そもそも絵を描くこと自体が好き」という人は学習されようが描いてネットに上げるんだと思うね。それが何年続くかは知らないが。結局は消費者ってのは絵の美麗さもそうだが、絵に宿る精神を消費してるわけで、その精神ってのは手書きだろうとデジタルだろうとAIだろうと宿るんだよね。俺は超有名な絵師の絵柄割って、本人が絶対に作らないであろう変態ドエロ画像を生成しているんだけど、本人には俺の精神がないからそんな画像を作り出すことはできないし、逆もしかりなんだよね。「こういうのいいよね」っていう世間へのプレゼン、今までは絵師しかできてなかったけど一般人もできるようになったっていう。そういうプレゼンの手法としてどれを取るかという話で、AIが発展しても絵を描く人間はいなくならないと思ってるね。デジタルが出てきてもアナログで描いてるやつ消えてないように

児童ポルノ問題←リアル描写のAI製児童ポルノに関しては俺は見たくないが、二次元キャラの非実在児童ポルノなんてのは日本にはありふれていて、むしろそういうのを守るためにオタクたちは一致団結してたんじゃないの？非実在なんで～とか18歳以上の設定なんで～ロリババアなんで～とかやってたわけじゃん。ここは確かにちょっと問題を孕んではいるが、どこから実在でどこから非実在かという部分を慎重に議論しなきゃいけんと思うけどね。反AI 原理主義はもはやフェミもびっくりの表現規制派と化しているので「非実在だろうが児童ポルノはNG」とか平気でかましてくる可能性もあるけどね。あいつら側から再度わざわざ非親告罪化とか言い出してるわけだし。

で、ここら辺からちょっと話がそれてきてるんだよね。イラストの話に、写真が入ってきてる。二次元画像の話じゃなくなってくる。あくまで話をイラストにとどまらせるのであれば「どこから実在でどこから非実在か」という話はするべきだと思うけど、ちょっと実在の写真がどうこうってなると手に負えないよねって話になってくる。じゃあ音声は？ChatGPTのような文章は？と、ここからどんどん話がずれてって、人類とAIみたいな話になりつつある…が、強硬に反AIを叫ぶ人たちは絵師とそのフォロワーしかいないのでした、と。今してるのはあくまでイラスト生成AIの話なもんで。なのでトランプ逮捕とかのディープフェイクなんかの話題も割愛

俺は普段NovelAIを使っていて、ここはDanbooruというイラスト専用サイトから学習しているらしいので写真は関係ないということでよろしく。これは「じゃあクリーンなデータなら受け入れるの？」っていう話でもあるね。

NovelAIは公式にDanbooru コンテンツで学習していることを明言している←で？何か問題ある？文句はNovelAIに言いなよ。もう学習は終了しちゃってるけどさ。さっきからずっと言ってるけど百歩譲って1ピクセルなんだよね。お気持ちでしかないよね

というわけで絵師のたわごとはあらかた論破しつくしました。

改めてイラストの画像生成AIの何がいけないのかがわからないなと思いました

ほんと反AIって表現規制に狂ったフェミナチみたいだよね。やってることまさしく表現規制だもん。1ピクセル分のお気持ちでしかないんだよね、自分は同人誌で他人の著作権侵害してるくせに自分は1ピクセルでも侵害されるのはいやだってお気持ち。本当は1ピクセルすらも侵害されてないくせに

今からでもフェミに土下座して宇崎のポスターの時みなさんのお気持ちに寄り添うことができずにすみませんでしたって謝ってこいよ

Permalink | 記事への反応(2) | 19:31

2024-04-29

■anond:20240429204403

sakugabooruとdanbooruって運営者関係あるのかな

なんかUIはソックリだけど

Permalink | 記事への反応(0) | 20:48

■才能の民主化 完全に理解した

　「生成AIによる民主化」を叫ぶパブコメが公開されて話題を呼び、「それは民主化ではなく共産化」という理解が急速に形成されている。この「民主化」という概念は何も9段の人物が考え出したものではなく、海外の生成AI 議論、特にイラスト関連の議論では頻出の概念であり何らかの生成AI推進過激派の共通認識だが、一方で「共産化」は少なくとも増田は寡聞にして知らぬ。では、この「才能」の「民主化」とは何なのか? 恐らく国内で理解されている形では「極一部の『絵師』と呼ばれる特権階級が、生まれながらに持っている、『絵』を生成する技術」を「広く一般が使えるようにする」こと、だろう。

　Financialization(金融化)という概念がある。1980年代から汎ゆるものを金銭的価値に換算する動きが加速し、万物が通貨によって交換できるようになる一方で、金融分野に加速度的に富が集中するようになってしまったとか、そんなような話だ。まあ安っぽいネオリベラリズム批判の一種と思って構わないが、このあらゆるものを金銭的価値と拡大の速度、加速度で考えるというプロ倫の延長線上にある思想は米国では広く一般に浸透している。

　だから二次元業界も当然この金融化の対象として、森羅万象を四半期指標の伸びとして変換すべしという思想の中で解釈される。このものは素晴らしい、だから儲けを加速しなければならない、という自然な発想がある。二次元イラスト業界を金銭的な側面で発展させようという試みは、2010年代を通じて諸外国で繰り返されてきた。無断転載で客を集めた後、批判を浴びて版権元と交渉しようとした漫画村事件もその一部だし、同人誌の代理購入や転売が行われたり、無断翻訳グループや各種の転載サイトの有料サブスクが販売されたりとか、仮想通貨イラスト作家を巻き込む動きも見られたし、画像ファイルを集めて転売するとか、無料の3D データを改造して勝手に売るとか、あるいは無料で転載して名を上げるとか、色々な試みがあった。個々の作家に対してあなたの作品はもっとビッグな儲けに繋がる、価格を上げるべきだ、販売数を増やすべきだ、出版が難しければ顔だって繋ぐ、といったオファーが野放図に撃たれることもあった。

　そのいずれにも日本の漫画業界、イラスト作家コミュニティは乗らなかった。日本は強固な「非営利の業界」を維持してきた。

　日本人は日本の二次元業界が作り出すソフトパワーをまったく過小評価している。増田はある時、海外のイラストレーターが何だかのソフトの互換性問題で揉めている所を見たことがある。PSDはPhotoshop から出力されるとは限らない、俺はKritaを使っているし現場によってはCSPを使っているとか、どうだかだった。お前らはCSPが何のことか分かるか? Clip Studio Paintだ。増田にとってこれはちょっとした衝撃だった。まったくのサプライズド・ピカチュウだ。分かるか? 国産商用ソフトウェアがイラスト制作ソフトの世界的御三家の一角を固めていて、Adobeが三位なんだぞ。「日本にはジョブズが生まれない」?「日本製のソフトは通用しない」? いや、増田自身、普段はこれを言う方なのだが、それでもだ。かつてはbukkakeが世界一有名な日本語だとか、不名誉で恥ずかしいとか言われたものだが、今では所によってはblack company、mesugaki、menhera moveですら通じる(最後はどこかの初号機の貢献だ)。

　そして、この継続的に世界に投射される存在感、その非営利思想(と、その裏でちゃんと行われているアニメやガチャゲー課金としての回収)は、思想的に原理主義的な低位のレイヤーにおいて、世界的に反発と軋轢を生み続けているのだ。

　もう一つ説明すべきことがある。共産化とは何なのか? 帝政ロシア末期のそれにしろ、中国のそれにしろ、共産主義革命とは、力を持たない民衆が団結し、腐りきった既存の体制を打破し、特権階級が貪る既得権益を破壊し、人民に還元する、という建前で行われる営為だ。実際にはこの「特権階級」は中流層以下を指し、既得権益とは単に日常生活を指す、ということはまともな人間なら皆知っているだろう。高級な壺を割り水道を破壊し公共施設を打ち壊し電線を鋳潰し、全てを焼き払ってゴミにするのが共産化、共産主義革命である。社会を破壊して所有の概念を、いや「社会」と「モノ」という概念の終了を目指すのが共産主義である。

　この「才能の民主化」と「それは共産化である」という批判はこれらを踏まえて解釈されなければならない。

　「民主化」による恩恵を得るのはお前らではない。「お前ら」というのはブクマカや増田のような言葉を持つ人間だけに限ったものではない。日本人ではない。ここまで書いてきたように、いま、諸外国には、日本(または中韓台を含む極東アジア)人は二次元イラスト業界で特権的な地位を得、極端なダンピングと異常な反成長主義を敷いている、という怒りがある。その怒りの文脈において、日本人は全て二次元の絵を生成し享受できる特権階級であり、才能の共産主義革命において虐殺される対象である。⑨段のパブコメを書いた「生まれつき手が震えて線が引けない」者など同情に値するわけがない。絵の金融化、イラスト市場の資本主義的成長を阻害してきた旧来体制を賛美する、唾棄すべき特権階級である。ポル・ポト政権の新国家建設の呼びかけに喜び勇んでカンボジアへ舞い戻り人民裁判に掛けられ次々と虐殺された出稼ぎ労働者たちそのものの姿だ。

　そしてその方法として、生成AI推進派たちは、Danbooruに(善意で)集積されたイラストを圧縮汎化させ任意に混ぜ合わせ薄めて取り出せるようにする。そのデータを配布し有象無象が使えるようにする。LoRAにより「絵柄」の神秘性を破壊し再現できるようにする。それらすべてはコンピュータの利用を強制して非属人的に実行されることで金銭的価値に還元される。

　だからあれは共産化なのだ。だから「生成AIを規制するならば二次創作も規制しろ」なのだ。つまるところ「生成AIによる才能の民主化」の指すものは、金銭的価値への還元を断固として受け入れない二次元イラスト市場の破壊そのものなのだ。文化庁の連中が考えているような「『民主化』による、日本国内の広く一般の者への価値の還元」は発生しない。民主化 AIで生産性を飛躍的に向上させたクリエイターの活躍などない。ソ連にまともな戦闘機がなかったようなものだ。仮にこれが「還元」だとするならば、起こるのはちょうど紙を高濃度の過酸化水素水で炎とガスに分解するような「還元」だ。「パブコメの知能が低すぎて困る」とかボヤいている場合ではない。それほどの、あえていえば低知能のもの、が反対一色に染まってパブリックコメントを送ってきているとはどういうことか? 実害を被っているのに他ならないではないか。

　この話のオチは、恐らく「生成AIによる才能の民主化」が実際にこのまま進んだとて、著作権法がAIウォッシング無罪を規定したとて、それは絵の価値が下がるという一過性の日本の純損失であって、別に日本的なイラスト創作文化への参入が海外享受者たちに認められるわけではないだろうことだ。Twitter上でも指摘されていたが、AIに点滅するカレットを与えられないから絵が造れないなどという者はいないのだ。完璧な絵をプロンプトで定義できると言うならばしてみるがいい。いや、Twitter上でもなんでもいい、人は文字が読めるのだから、完璧な絵の定義を書けばそれは作品なのだ。件の人物が長々とコメントを書き、そしてバズりを作り出したように。

飽きた。ここで投げる事にする。ナガノのくまを讃えよ。

Permalink | 記事への反応(0) | 09:39

2024-03-03

■anond:20240303113606

＞「たとえ海賊版や個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。

＞ですが仮に、ある漫画家が「海賊版サイトで漫画を読みまくって漫画を勉強しました」と発言したら、とうぶん仕事を失うでしょう。違法行為であるかは別として社会的、倫理的に許されない行為であることは明白だからです。

それは学習どうこう以前に、海賊版漫画をダウンロードすること自体が違法やんけ。

まさか未だに映画と音楽だけが違法だと思ってるのか？　2021年に漫画にも拡大されたぞ。

一方でアメリカにはフェアユースがあるので、Danbooruが倫理的に問題があるのか俺には分からん。

そしてそこから学習したAIを使うことに問題があるのかはもっと分からん。

まあ法律の専門家や文化庁が何も言ってないってことは問題ないんだろう。

お前みたいなどこの誰とも知れない匿名増田の言うことなんて誰も真には受けないよ。

Permalink | 記事への反応(0) | 14:16

■生成AI推進派が触れたがらない海賊版 データ 問題

文化庁のAIと著作権についてのパブコメの結果が話題ですね。自分も2万件超のコメントの一つです。副業程度の収入を得ているアマチュア絵描きとして、生成AIには何らかの規制が必要であるという立場でコメントを送りました。

主要な問題としてコメントに書いたのが、生成AIの学習に海賊版（違法アップロードコンテンツ）が使われている問題です。

https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/hoseido/r05_07/pdf/94011401_01.pdf

文化庁 PDFの30〜32ページに海賊版、つまり違法にアップロードされた書籍、写真、動画、絵などをAI 学習に用いることについての意見が並んでいます。文化庁の見解としては、生成AI 事業者が海賊版であると知ったうえでコンテンツを学習に用いた場合、事業者は権利侵害の責任を問われる可能性があるとの考え方のようです。

もとより、ウェブには権利者に無断でアップされたもの（創作物だけでなく写真なども含む）が溢れかえっていることは周知の事実です。ウェブから効率よく膨大な学習データを求めれば、そうしたコンテンツが混ざってくることは当然なわけです。それを承知のうえで、生成AIの開発は行われている。

これはクリエイターや企業の著作権にとどまる問題ではありません。海外では、画像生成AIの学習データに児童ポルノや個人のプライバシーに関わる画像が含まれていることも指摘されています。自分の知らないところで自分の写った写真がウェブに放流されAIの学習対象になっている、ということもあるのです。

「たとえ海賊版や個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。

ですが仮に、ある漫画家が「海賊版サイトで漫画を読みまくって漫画を勉強しました」と発言したら、とうぶん仕事を失うでしょう。違法行為であるかは別として社会的、倫理的に許されない行為であることは明白だからです。

となれば、生成AIの学習に海賊版を用いることも同様に許されないでしょう（特に、AI 肯定の立場から言われる「人間の学習とAIの学習は同じ」という見方ならば）。

クリエイターが、海賊版を学習したAIをそうと知って自身の創作に使うことは、間接的な海賊版の容認とも見なされるかもしれません。

非倫理的な学習方法によって成り立っているのが生成AIの現状です。批判的な立場からクリーンな学習データによるAIが求められるのはこのような理由もあるわけです。

残念なことに、生成AIを肯定・推進する立場の人々はこの学習データ問題に触れたがりません。自分の見てきた範囲ですが、本や記事やSNSで、ここに真摯に向き合っている人はいません。

「ディープフェイクや特定個人の模倣などの悪質なAIの使い方だけが問題だ」という主張をし、その範囲では厳しく批判をする人はいます。もちろん悪質な使い方は許されません。しかし、自身の使っている生成AIがその学習の成り立ちから非倫理的である可能性には触れません。認めると面倒なことになるのがわかっているからでしょう。