はてなキーワード: danbooruとは
そもそもの話、X社は画像生成AIなど作っていない。彼らがつくっているのは検索支援AI Grok。学習に使いたいのはテキストの方であって画像ではない。
わかりやすさのために ChatGPTと比較してみる。2023年にリリースされた GPT-4 に試しに今期のアニメについて質問してみよう。
今期最も人気のアニメはなんですか?
ChatGPT:
2024年の今期で人気のアニメはいくつかありますが、「進撃の巨人」や「呪術廻戦」が特に注目を集めています。また、新作では「東京リベンジャーズ」や「スパイファミリー」も話題です。どの作品に興味がありますか?
アニメに詳しい人ならちょっと古い話をしているのがわかるだろう。 GPT-4 が学習を行なったのは2023年までの情報だ。なので最新の話題に対応できないのである。
一方、Grok は Xの投稿をリアルタイムに検索して反映する。もし Grok で同じ質問をすればダンダダンやリゼロ、ブリーチ辺りの話をするはずだ。つまり、Xが収集したいのは「ダンダダンの7話泣かされたわ・・・」みたいな投稿のことであってイラストではない。
Grokには画像生成機能がついているが、これは自前の物ではなく Black Forest Labs社 の FLUX.1 というモデルである。X社が Xに投稿されたイラストを収集して学習させているわけではないのだ。それでは FLUX.1 の訓練に使ったのはどこの画像なのだろうか?データセットは明らかにされていないが十中八九使っていそうなのが LAION-5B である
現在大手の企業は「著作権的にクリーンな」画像生成AIをつくっているが実際には版権物が出てくることが知られている。なぜそんなことが起こるのだろうか?
このからくりは LAION のデータセットにある。LAIONはドイツにある非営利組織。ネット上のありとあらゆる画像を収集しタグをつけたデータセットを公開している。
A. LAIONは非営利の研究組織です。ドイツの著作権法(§60d UrhG)に従いあらゆる著作物の利用が許されています。
とあるようにドイツの法律上合法である。実際に訴えられた後LAION側が勝訴している。とはいえこの組織にはAI関連企業からの多額の寄付金があることが知られており、パチンコ3店方式のような意味合いでの合法とも言える。
尚、反AIさんと反々AIさんが著作権法第30条の4を巡って喧嘩をしていますが、世界では日本の法律は関係ないです。いちおう念の為。
他の絵師さんに Glaze を使うように詰め寄ったり、使わないやつはAIに加担していると攻撃したり。挙げ句の果てには「自分の絵にGrazeをかけました」と宣言したり。
もう、全てが間違っている
そもそも、Glaze も Nightshade もAI学習を阻害するものではない。学習したモデルをぶっ壊す毒なのである(poisoned って書いてあるでしょう?!)
相手に食わせなければ意味がないんだ。Glazeかけたとか自分で言うな。対策されるでしょう?(後述)
それと他の人に強要する意味はない。使いたい人が使えば十分なんだ。
事実すでに効果は上がっていてOpenAIは悲鳴をあげ対策を急いでいる。
反AIさんの考えるよりも Glaze/Nightshade はずっと強力だ。それはデータセットを汚染する攻撃である。簡単に言えば Nightshadeは「学習中に他の絵に変換されてしまう」ノイズをかける。この操作を毒入り(poisoned)と呼ぶ。ピクセル毎の微小な変更なので Nightshade をかけた後もイラストはぱっと見はかわらない。
Nightshadeを使って例えば 犬の画像を猫の画像になるノイズをかけたとする。するとAIは犬と猫が混ざったまま学習を進め「犬」と言う概念が無茶苦茶になってしまう。
図:毒入りモデルの変化 (arXiv:2310.13828から引用)
上の図は毒入りの画像を200枚食わせたときの変化の様子だ。犬が猫になってしまっている。それだけではなく”犬”に近い概念、”子犬”、”ハスキー”、”狼”もぐちゃぐちゃになっている。
図:毒入り枚数による変化 (同引用)
こちらは50、100、300、と毒入り枚数を変化させたときの様子。50枚の時点ですでにめちゃくちゃになっている。
もし私が反AIだったなら、イラストに Nightshadeをかけて danbooru に投稿するだろう。二次元イラスト特化の画像生成AIはdanbooru2021/ danbooru2022 などのデータセットを使っているものと見られる。これらはイラスト投稿サイトdanbooru から収集したものである。
ところで Glaze も Nightshade もその内部で画像生成AIを使っているということを知ったら反AIさんはどんな顔をするだろう?
Glaze は特徴量抽出を行う。おそらく Stable Diffusion の VAE(Variational Autoencoder)を使っている。そしてNightshade の方も 内部ではStable Diffusion 等の画像生成モデルを用いて別の画像を生成する。
Glaze が機能しない?あるいは解毒方法が見つかったかもしれない
上のスレッドのコメント欄では Glaze が論文のようには機能しないことについて議論され「画像のリサイズをしたのではないか」と予想している。Glazeをかけた後に画像を縮小、データが圧縮されてノイズ効果が消えたのではないかということだ。
A) 絵師さんが Glaze をかけたあと画像を縮小した可能性
B) 画像サイズやファイルタイプによってはプラットフォーム側が勝手に加工をする
C) 学習の際にリサイズを行う (Stable Difusion XL では1024px, 古いモデルは512px)
A,B については絵師さん側に知識があれば対処可能だけれども C の方はなんともし難い。小さい画像を投稿したところで [縮小→拡大] でノイズは落とせそうだ(解像度は悪くなるだろうが)
LAIONは収集画像そのものを所有せず、データセットはウェブ上にある画像のurlとタグをまとめた物であるらしい。
ということは、LAIONの新しいデータセットが公開されたタイミングで画像のurlを変更すれば学習に使われることを回避できそうだ。特に、個人サイト/ブログの所有者ならば古い url に●んこ画像でも差し替えておけば嫌がらせになる。(タグ差し替えはこのグラフの Simple Attak に相当)
90年代においては画像に直リンクされたときの報復としてうん●画像に差し替えたものです。まさか令和になっても有効とはね
この記事をぼちぼち書いているいるうちに2日が経過した。今、私のXのタイムラインもおすすめもとても静かだ。攻撃的な人たちやデマに流されやすい人達は皆どこかに行ってしまったようだ。残ったのはこれまで静かにイラストを描き続けてきた人たちでとても穏やかな空気が流れている。ずっとこのままがいい。
聞いてみた。
Danbooruがタグ荒らしに対抗して新規のタグの登録を停止した場合、画像生成AIの学習に影響はありますか?
Danbooruがタグ荒らしに対抗するために新規タグの登録を停止した場合、画像生成AIの学習にいくつかの影響が考えられますが、特に以下の点で学習や生成に影響が出る可能性があります。
新規タグの追加が停止されると、新しいキャラクターやトレンドに関連するタグが登録されないため、最新のコンテンツに対応できなくなります。特に、人気のアニメやゲームが登場した際に、関連するタグが登録されないと、それに基づく画像生成モデルの学習が行えず、最新トレンドのキャラクターやシチュエーションの生成が難しくなります。
既存のタグのみで運用を続けると、同じタグが繰り返し使われるようになり、データの多様性が減少します。この結果、画像生成AIは一部のテーマやスタイルに偏りやすくなり、学習データのバリエーションが乏しくなる可能性があります。例えば、「夏のシーン」や「ハロウィン」などの季節限定のテーマや、新規のアートスタイルに対応するタグが欠如することで、生成画像に多様性が不足しやすくなります。
新規タグを作成できない場合、似たテーマや特徴を持つ画像が既存のタグに集中する可能性があり、既存タグの意味が曖昧化し、データの品質が低下する可能性があります。たとえば、新規キャラクターが増えた場合でも、それに対する適切なタグが登録されないため、類似キャラクターに関連するタグに無理やり分類されることが起こり得ます。これにより、画像生成AIがキャラクターの特徴を正確に学習できず、生成結果に混乱が生じやすくなります。
タグが新規に追加できないと、キャラクターの詳細な設定や特定のシチュエーションに対するラベルが不足し、タグの細分化が進まなくなります。たとえば、「笑顔のキャラクター」と「怒っているキャラクター」を区別する新しいタグが追加されないと、感情表現のバリエーションが不足し、AIが生成する画像の感情表現が単調になりがちです。
生成AIの改善やリファインには、タグの精度や多様性が重要です。新規タグの登録が停止されると、生成AIを精度良く改良するための情報が制限され、モデルの改善が遅れる可能性があります。また、タグの種類が限られることで、学習の進捗や再トレーニングの際の効果も限定的になり、モデル全体のパフォーマンスに影響が出ます。
新規タグの登録停止はタグ荒らし対策としては効果が見込まれますが、同時に学習データとしての価値も低下させるリスクがあります。荒らしのリスクが減少する一方で、最新データへの対応が困難になり、学習データとしての柔軟性が損なわれるため、画像生成AIが最新のスタイルやコンテンツを再現する能力が低下します。
新規タグの登録停止は、タグ荒らし防止には一定の効果を持つものの、画像生成AIの学習には制約がかかるため、生成画像の多様性や精度に悪影響を及ぼす可能性があります。
画像を生成するAIによる無断学習や利用を防ぐために、以下のような対抗手段を講じることが可能です。
1.透かし(ウォーターマーク)の埋め込み:
画像に目に見えるまたは見えない透かしを入れることで、無断利用や生成AIの学習に対して抑止効果を期待できます。特に、目に見えない形で画像データに暗号的な透かしを埋め込む「デジタル透かし」技術が有効です。
画像データに著作権情報や「AIによる無断学習を禁止する」といったメタデータを埋め込み、ウェブサイトには robots.txt ファイルで画像クローラーのアクセスをブロックする設定を追加します。これにより、クローリングや収集の抑制が期待できます。
ステガノグラフィを用いて、画像に気づかれにくい形で識別情報を隠すこともできます。これにより、画像の流出経路や利用先を追跡でき、無断利用の発見に役立てることができます。
4.法的な警告表示や利用ポリシーの明示:
ウェブサイトや画像の配布先に、AIによる無断利用や学習を禁止する旨の法的警告や利用ポリシーを明示することも有効です。利用条件をはっきりと示すことで、AI企業や研究者が慎重になる可能性が高まります。
AIが利用しにくいように、画像に人間には気づきにくいパターンやノイズを挿入する技術もあります。たとえば、AIにはノイズとして認識されるが、人間には問題なく見える小さな変形やカラーパターンを追加することで、AIによるデータ学習が困難になる場合があります。
生成AIの学習を混乱させるための手段には、以下のような方法が考えられます。
1.ノイズや歪みの追加:
画像に目立たない程度のノイズや歪みを加えることで、アノテーションモデルが境界や特徴を正確に認識しにくくする手法です。たとえば、ピクセルレベルでランダムなノイズを追加する、わずかに画像をぼかす、あるいは境界線付近に小さな変化を加えるといった手法が有効です。
アノテーション処理は、対象物の輪郭や特徴を正確に捉えることが重要です。そのため、背景や対象物の輪郭にわずかな不規則性を加えることで、アノテーションツールが対象物の境界を正確に判断しにくくすることができます。たとえば、背景に模様や偽の輪郭を挿入する方法です。
画像に人間には視認しづらい形でテキストやラベルを埋め込むと、AIのアノテーションプロセスが混乱する場合があります。これにより、AIが意図しない領域を注視することがあり、誤認識を誘発します。
4.色や明るさのランダム変化:
画像の色や明るさを部分的に変化させ、一定のパターンを持たないようにすることもアノテーション処理の混乱を招く一手です。これは、オブジェクトの検出や認識が色や明暗の差異に依存している場合に有効です。
5.擬似的なオブジェクトの追加:
画像内に小さな擬似的なオブジェクトや模様を追加することで、AIがそれらを誤って主要なオブジェクトと認識し、アノテーション精度が低下する可能性があります。特に、背景に似たオブジェクトを散りばめることで、AIはどの部分が対象なのか判断しにくくなります。
AIの認識を誤らせるために用いられる「アドバーサリアル(敵対的)な例」を使う方法もあります。特定のピクセルパターンや色の配列を配置することで、AIのアノテーションが意図的に誤作動するよう誘導できます。この技術は深層学習モデルに対して特に効果があります。
画像全体にわずかなカモフラージュパターンを重ねることで、AIの認識を混乱させる方法です。この手法では、人間が見た場合には問題なく認識できるものの、AIが対象を捉える際に誤って検出するようなパターンを画像に追加します。
・思考実験として、danbooruなどアノテーションの元データとして使われているサイトのタグが荒られたら画像生成AIのモデル作成にダメージはありますか?
思考実験として、Danbooruといったアノテーション元データのタグが荒らされた場合、画像生成AIのモデル作成に与える影響は以下の通りです。
Danbooruは、イラストや画像に対して詳細なタグが付与されており、これらのタグ情報は画像生成AIの学習にとって非常に重要です。タグが荒らされることで、画像とタグの対応関係が崩れ、モデルが正確な特徴を捉えにくくなるため、生成精度が低下します。
例えば、特定のキャラクターやテーマに関連するタグが荒らされ、誤った内容のタグが付与されると、モデルはその誤った情報を学習し、キャラクターの特徴や設定が再現されにくくなる可能性があります。
タグが荒らされると、モデルの訓練にノイズデータが増えるため、学習効率が悪化します。たとえば、「黒髪」のタグが誤って「金髪」などに変更された場合、モデルは同じ画像に対して異なる特徴を学習することになり、結果として生成画像の一貫性が失われることが考えられます。
また、同じ画像に異なるタグが付与されることで、モデルが過学習や誤学習を引き起こし、生成された画像が本来の意図からかけ離れたものになる可能性もあります。
Danbooruでは、特定のキャラクターやアートスタイルを識別するタグが多く存在します。これらが荒らされると、特定のキャラクターやスタイルのデータが混乱し、モデルが正確にキャラクターの特徴を把握できなくなるため、ユーザーが期待する生成結果が得られにくくなります。
例えば、あるキャラクターのタグが「髪型」「服装」「色彩」などで荒らされると、そのキャラクターの再現が曖昧になり、モデルが正しいビジュアルを生成できなくなることがあります。
タグが荒らされると、データセット全体の信頼性が低下します。信頼性の低いデータをもとに学習したモデルは、特定の条件で異常な出力を生成することが多くなり、モデル全体の品質が低下します。これは、生成AIが学習中に「どの情報を信頼すべきか」を判断できなくなるため、生成結果が不安定になったり、多様性が失われたりすることが考えられます。
AIモデルを利用するユーザーは、タグを通じて希望する画像を生成したり、条件に合った画像を探します。タグが荒らされると、AIモデルの検索・フィルタリング機能の精度も低下し、生成プロンプトが期待通りに機能しなくなる可能性があります。たとえば、「風景」タグが荒らされ、異なるジャンルの画像が混入するようになると、風景画像を生成したいユーザーの要求が満たされにくくなります。
Danbooruなどのタグが大規模に荒らされた場合、生成AIモデルの精度低下や一貫性の欠如が発生しやすくなり、特にキャラクターや特定のスタイルに依存する画像生成モデルに大きなダメージを与える可能性が高いです。
すでに学習済みのモデルを使って汚染されたデータのクレンジングや異常値検出を行うなど対策される可能性がありますが、それらを阻害する手段はありますか?
無断での学習を妨害し、学習コストを増加させるために、上記の方法を阻害する手法には以下のようなアイデアがあります。これらの手法は、意図的にデータセットの品質や一貫性を崩すことで、学習モデルの精度を低下させ、データクレンジングや異常値検出のプロセスを複雑化することが目的です。
意図的に誤ったタグや無関係なタグを画像データに付与し、データセットの信頼性を低下させます。これにより、転移学習やラベルノイズ検出が困難になり、正確な特徴量を学習するコストが増加します。
例えば、キャラクター画像に全く無関係なタグ(「動物」や「風景」など)を追加することで、モデルがどのタグが信頼できるか判別しにくくなり、誤ったラベルがノイズとして学習されるリスクが増えます。
2. 特徴量をぼかす/微妙な変更を加える
特徴量ベースのクレンジングや類似度分析に影響を与えるため、画像の特徴がわずかに異なるように加工を施します。具体的には、色調を微妙に変える、ランダムなピクセルの位置でノイズを追加する、または特定の部位を意図的にぼかすことで、モデルが抽出する特徴量の安定性を低下させます。
この方法により、同じキャラクターやスタイルであっても類似度分析が困難になり、正確なクレンジングが行いにくくなるため、データ処理のコストが増加します。
特徴が異なるバリエーションや擬似的な異常データを大量に追加することで、異常検出アルゴリズムの信頼性を下げます。たとえば、キャラクターのデザインや背景を少しずつ変えた画像を意図的に作成することで、異常値検出が頻繁に誤検出されるようにします。
こうしたデータが混在することで、オートエンコーダーやアンサンブルモデルを使った異常検出が混乱し、正確な異常サンプルの抽出が困難になります。
4. 高頻度で微小なラベル変更を行う
学習済みモデルの転移学習やラベルノイズ検出を阻害するために、同じ画像に対してラベルを定期的に変える手法です。微小な変更を行うことで、モデルは正しいラベルを安定的に学習することが難しくなり、モデルの信頼性が低下します。
例えば、ラベル「黒髪」を「暗めの髪」や「濃い色の髪」などに頻繁に切り替えることで、学習に不確実性を持ち込むことが可能です。
データセット内で非常に類似した画像を複数の異なるタグで登録することで、モデルの学習を混乱させます。特定のキャラクター画像を少しずつ変化させて複数のタグを付けると、モデルは「どのタグがどの特徴に対応しているのか」を判別しにくくなり、データセットのクレンジングが複雑化します。
特に、タグの一貫性が失われるため、類似度分析やアンサンブルモデルによる異常検出の効果を低下させることが期待できます。
AIモデルが認識を混乱させるように、アドバーサリアルノイズ(敵対的な例)を追加します。人間にはほとんど気づかれないレベルのノイズを画像に追加し、モデルが特定の特徴を正確に認識できないようにすることができます。
このノイズにより、モデルの特徴量ベースの学習が混乱し、意図した通りに学習できないため、クレンジングの精度も低下し、データ処理の手間が増加します。
特定のルールではなくランダムにタグをつけたり、特定のカテゴリ間でランダムにラベルを入れ替える方法です。これにより、ラベルと画像の関連性が薄れ、アノテーションの一貫性が失われます。この乱数による偽ラベルの付与は、ラベルノイズ検出やアノマリー検出において、真のラベルを見極めるコストを大幅に増加させます。
まとめ
これらの手法は、AIの学習やクレンジングを意図的に妨害し、無断学習にかかるコストを増加させるために有効です。特に、「微小な変更」や「アドバーサリアルノイズの付与」といった手法は、見た目の品質に影響を与えずにモデルにノイズを持ち込むため、非常に効果的です。
DMCA申請フォームから何度も申請を出しているのに全く消さない。
自分の申請文が変なのかと思い、人に相談しながら内容を精査して削除を試しているが、そもそも添えたURL(証拠データをアップした場所へのリンク)へのアクセス履歴がついていないので、見て貰えているのかすら分からない。
本名、メアド、住所(号室まで書いた)、電話番号、転載先、転載元のURL(数十点)、証拠データへのリンクに署名、
全て書いているのに、そもそも向こうが証拠を閲覧しようとすらしていないのではどうしようもない。
最初のうちの申請文はシンプルだったが、修正や説明を加えて何度も削除を頼んでいるので、作者本人なのに迷惑ユーザーか虚偽の申請をしてきた人か何かだと思われてしまっているのだろうか。
Danbooru側が私自身を信用していないのであれば弁護士に代行してもらうしかないと思って、今は代理人になってくれる弁護士を探しているところだ。
今は絵描きからのDMCA申請も殺到しているだろうし、嫌々削除対応してちょっとでも面倒くさそうな絵描きは無視してるんだろうな。迷惑だから早くサイトごとなくなってほしい。
たとえばdanbooruでなら百万単位でヒットするくらいメジャーな身体の部位についてのタグがあるのだけど、女性人気のジャンルでは該当する画像にもほとんどタグがつけられていない。
おそらく、このフェチズムを理解するのは男性ばかりなのだろう。
同じくdanbooruでは数十万単位でヒットするようなメジャーなタグがあり、日本人が描く画像はかなりの割合で該当するのだけれど、日本人はそのタグをほとんどつけない。
他方、たとえば日本の作品の該当するキャラ(非常に多くが該当する。)を外国人が描いた画像の場合には、ほぼ確実にこのタグがつけられている。
おそらく、日本人以外からは「日本人は○○フェチだ」と思われているが、我々は無自覚なのだろう。
(蛇足だが、自分の知る限り、「日本人はかわいいと言うが現地ではそうでもない外国人女子」はだいたいこのタグがヒットするタイプ。
オフラインの知り合いに聞いた限りでは、この属性は欧米ではネガティブに捉えられている。)
このような傾向を踏まえた上で、国や集団ごとの好みの傾向を定量的に把握したい、と思っている。
「肌が綺麗」のようなどの国でも肯定的に評価される属性に対する地域ごとのウェイトの違いであれば、より容易に検証できるだろうが、そうではなく、「A国では減点要因だけどB国では加点要因」のようなはっきりと好みの分かれる属性を調べ上げたい。
昔絵描きだったが最近は長いこと絵を描いてなかった、でもAIのおかげでオタ趣味に復帰できた気がするのでAIにはちょっと感謝している。
成人向け動画共有サイトでエロ動画を検索していても、自分が望んでいるシチュエーションのエロ動画がヒットされにくいという問題がある。(「あの恰好であの体位でしている動画が出てこない」とか。)
Danbooruなどの二次絵に特化したサイトだと、静止画という特性上、1場面しか表されていないため、的確に画の状況をタグ付けして内容の特徴を浮き彫りにしやすい。
しかしエロ動画サイトの動画となると、動画内には場面が何場面もあり、カットやシーンによって画の特徴が変わりやすいから、
もしエロ動画視聴ページでDanbooruみたいにタグ付けをやろうとすると 示唆してるタグとシチュエーションがまちまちになって来たり(※)、もしあえて動画内の全特徴を列挙すると タグの数が膨大になる可能性がある。
なのでアップロードされた動画には、動画タイトルや動画説明と、タグでは 演者とか 主なシチュエーション(どういう設定物のAVか)とか 付けられる属性や情報が少なく、ざっくりしている。
それで「検索ではそれっぽい動画の候補は出すからあとはその中から自分の目で確認して」となる。
(※どういう事かというと例えば、「トップビュー」「正常位」「騎乗位」…… というタグが付いてたとして、動画を見ると「トップビューの騎乗位と、女側視点の正常位」の内容だった。期待した「トップビューの正常位」にならない訳で。)
多分「YouTubeの検索機能がゴミ」「ニコニコ動画の検索の方が使いやすい」と言われるのは、そういう都合なのだろうと。
ニコニコ動画なら、MAD動画とかゲーム動画とか趣旨が分かりやすい動画が多いだろうから、タグを中心とした検索がうまくいくが、
YouTubeとかになると、掴み所のないカットが多かったりする動画も割とあるわけで(日常のスナップ動画や 長回しの動画とか ライブ配信とか)、タグ付け的に一概には括れないのだろうと。
YouTubeの検索機能がAI的に検索結果を提示しているのは、そういう曖昧な動画にも対応できるようしたためなのだろうと。(「広告的な動画を検索結果に挟む」という商業的な都合を除く。)
ニコニコ動画にあるような趣旨が分かりやすい動画を探し求めてる利用者は、YouTubeが意図してる検索機能の目的と合ってない。
(余談だが、ネットでは「YouTubeの検索機能が使いづらい」とか目にすることがあるが、エロ動画共有サイトについてはそういう話があんまり上がって来ない印象がある。
自分はSNSをやってないし5chとか深入りしてないので、エロ動画サイトの検索機能に皆どう思っているか知らないが、皆不満に思っていないのか?)
もしこれから新たなエロ動画共有サイトができるとして、検索精度を上げていたなら、動画のチャプターごとにタグ付けができるようなサイトの作りになってるとか?。。。
自分はポルノやAVとかのエロサイトにあまり詳しくないから、過去にそういうエロ動画サイトがあったかは知らないが、そういうDanbooruみたいにタグ付けできるエロ動画共有サイトは需要はあるのかもしれないと思った。
ちなみに自分は、元々エロは二次元派(インピオ・ケモノ)であるがアラサーになり、2年前から本格的にPornhubのようなエロ動画サイトも覗くようになった程度のユーザーです。(児童ポルノ動画は見てない。)
----
昨日の20時か21時台、昨日の23時~23:42、今日の02時~02:45にオナニーしてたんだけども、
21時台に、かつてから自分が追い求めていた条件にピッタリ合う三次元のエロ動画をPornhubで見つけて、その後にも同じオカズで無我夢中で一心不乱にシコったんだけども。(ちなみにオーガズムな快楽の後に、疲労感のような負荷が強く感じた。繰り返すと廃人なりそう。)
毎日毎回探していたわけではないが、オナニーをする前にしているズリネタ収集時で、気が向いた時にたまにの頻度で、その条件をエロサイトでキーワード検索していて「意外と見つからないな」を、かつてから不定期に繰り返していたが、
その条件の動画を見つけた昨日までの間どれくらい掛かったを おおよそ振り返ってみると、1~2年以上探していた事になってた。
どうして自分の求めてるシチュエーションのエロ動画が、こんなにも見つかりづらかったんだろう?と思ったんだけど、雑に単純計算をしてみた。
vaginalで、 missionary_positionで、 multiple_girlsとmultiple_boysのfoursomeで、 2 couplesで、 top_viewで、 uncensoredで、 huge_penisで、 large_breastsで、 gyaruで、 黒人以外で、 ……。 (ここの行、画を思い出しながら単語の羅列を書いていて勃って来る。)
という風に条件(自分がエロ動画に求めてるシチュエーションや特徴や属性や要素)を挙げて見てみると、10個以上もこだわりがある事が分かり、
じゃあ「その条件らに全て一致して貫けれた動画を見つけれる確率ってどれくらいなのか?」とざっくり確率を求めるに、
条件一つを真偽値(有無の2パターン)とすると、2の10乗、1/1024。
そして、エロ動画サイトの検索機能は、・かなり曖昧(ニコニコ動画はともかくYouTubeよりもヒットしづらい) ・多くキーワード条件を入れられない(削り過ぎてしまう)、など都合があるので、少い条件・低精度の検索機能を使って虱潰しに片っ端からエロ動画を見ていかないといけない。
つまり最低でも1024個の候補のエロ動画の中から1つしか自分が求めてる特徴のエロ動画が出てこない。(さらに仮にその条件で確実に絞れて出てきても、内容のディティールとかピッタリ自分の好みに合うかは動画を観るまで不明。)
ようやく1/1024以上の確率で本望のエロ動画を見つけられたが、こんな事に執着するぐらいだったら性欲を捨てたい。数年後また違う性的嗜好のエロ動画を求めて エロ動画サイトを漁って時間を浪費していたくない。
そういう低確率(希少性)な快楽になる物を発見したらしたで、その後、依存症的に振り回された疲労感がセットで来る。割としんどい。まるでNuggetsのようだ。
ちなみに自分は30歳で、1週間に約2回(3日に1回)オナニーしていて、1日1時間のオナニーで1回出せば満足。(オナニーし始めた14年前から変わらない習慣。)
8割以上は、二次元派なので、AVはあまり見ない方でAVとか詳しくない。AV女優とか詳しくない。
余談:
二次元のエロ絵やエロ動画は、PixivやDanbooru系のサイトでタグ検索で手間もかからず自分の好きなエロコンテンツを見つけられるが、
三次元のポルノやAVで自分にピッタリ合うエロ動画を探すのに、なんでこんなに見つけづらいんだろう? ドンキホーテみたいにわざと物を見つけづらくしている? 買い物依存的?
----
イラスト生成aiについて、普段使っている絵のアカウントでは言うと燃えかねないのでここで吐き出し
<お前は誰だ?>
趣味絵師。FANBOXやskebで多少のお小遣いを頂けることもあるが企業案件の経験は無し。
自分はアナログはてんで描けず、デジタル作画ソフトが進化することである程度の絵が描けるようになった人間。
イラストaiだってツールとして使う分には問題ないと思っているし、使えるもんなら使いたい。
仕上がったものが他人のパクリになってないのが重要なのであって、その過程って割とどうでもよいと思う。
<無断で自分の絵を使われることについて>
個人的には、自分が描いた絵を無断で使われることにそこまでの忌避感は無い。
画像検索で資料を探すし、気に入った絵の描き方・塗り方は参考にする。
もっと言うと、他人の著作物を用いたR18画像は描いてるし、ニコニコ動画の著作権物が大量に使われたMADも楽しんできたし、漫画の一コマを無断転載した大喜利にも爆笑してきたし、ユーチューブで無断転載されてる作業用BGMを聞いてきた。
なので、なりすまし等の明らかに悪意を持った使い方でなければ、一度webに上げた絵はどうぞ好きにしてくれというスタンスでいる。
(danbooruは勝手に自分の絵を保存してくれるからある意味助かっている。)
生成物がパクリになる?i2iで直接読み込まない限りはパクリレベルの絵は生まれないよ。
ai派に対しては、成りすましとか、特定の絵師に粘着するのはやめれ。
それはaiでなくてもアウトなことだ。
aiを嫌うのは自由だけど、それで所構わず他人の絵にai疑惑をかけたりするのは違うよ。
画像生成AIは何が問題なのか?というwikiを見て頭のほうにいろいろ書いてあったけどさhttps://w.atwiki.jp/genai_problem/pages/10.html#id_c770cabd
もともとネットに落ちてた画像って公開情報でしょ?それを元に学習して何が問題あるの?
もともとはんこ絵と呼ばれていたイラストを学習して新たなイラストを生成することの何が問題なのか
学習もとへの還元がない←必要ない。お前の絵の要素が俺の生成した絵に何かしらの影響与えてたとして、1ピクセルぐらいのもんだろ。これ百歩譲って画像生成AIが何かしらのコラージュを作るような機械だった場合の話であって、そもそもコラージュを作る機械ではない
学習元が作った成果物によって、学習元の市場と競合する存在になりえる。←知らん。そもそも1ピクセルで大げさに騒ぎすぎ。こういう「我々は被害にあった、犠牲になった」みたいな大げさな態度とるくせに自分はちゃっかり二次創作で他人の著作権侵害して金もらってるそのダブスタどうにかしろ
学習元の模倣による類似品が容易に製作できる。←知らん。個別に現行の著作権法で対応すればいい。念のために言っておくが画風や絵柄に著作権はない
生成スピードが早く、類似品を出すことが容易なため、表現の陳腐化も早い。←知らん。どうでもいい
生成スピードが早いために、プラットフォームへの投稿速度、量ともに尋常ではない。←ま、ちょっとわかる。けど、マスピ顔も過去のものとなり客にも「結局抜ければ何でもいい」と言われ始めているし、今後質が上がるのならそもそも別に悪いこととは思わない。後はプラットフォームの運営の考え方次第
i2iやControlNetをはじめとする技術によって、盗作が容易であるとともに証明する事が困難。←画風や絵柄に著作権がない上で何をもって盗作と認定しているのか。フェミ同様推定無罪の考え方を放棄しているように見える
とりあえずざっくり大見出しだけ論破した。その他「どうでもいい」だけじゃ足りなさそうな小見出しを論破していく
生産者減少に伴う産業の衰退←Xでは画像を学習させると明言しているにもかかわらず今でも普通に絵が流れてくる。俺は結局絵を描くことが好きな奴は絵を描くことをやめれないんだと思うよ。描いて、それを人に見せたいから学習されると知りながらもネットに上げる。「絵を描いてちやほやされたい」だけの人は筆を折るだろうが、「そもそも絵を描くこと自体が好き」という人は学習されようが描いてネットに上げるんだと思うね。それが何年続くかは知らないが。結局は消費者ってのは絵の美麗さもそうだが、絵に宿る精神を消費してるわけで、その精神ってのは手書きだろうとデジタルだろうとAIだろうと宿るんだよね。俺は超有名な絵師の絵柄割って、本人が絶対に作らないであろう変態ドエロ画像を生成しているんだけど、本人には俺の精神がないからそんな画像を作り出すことはできないし、逆もしかりなんだよね。「こういうのいいよね」っていう世間へのプレゼン、今までは絵師しかできてなかったけど一般人もできるようになったっていう。そういうプレゼンの手法としてどれを取るかという話で、AIが発展しても絵を描く人間はいなくならないと思ってるね。デジタルが出てきてもアナログで描いてるやつ消えてないように
児童ポルノ問題←リアル描写のAI製児童ポルノに関しては俺は見たくないが、二次元キャラの非実在児童ポルノなんてのは日本にはありふれていて、むしろそういうのを守るためにオタクたちは一致団結してたんじゃないの?非実在なんで~とか18歳以上の設定なんで~ロリババアなんで~とかやってたわけじゃん。ここは確かにちょっと問題を孕んではいるが、どこから実在でどこから非実在かという部分を慎重に議論しなきゃいけんと思うけどね。反AI原理主義はもはやフェミもびっくりの表現規制派と化しているので「非実在だろうが児童ポルノはNG」とか平気でかましてくる可能性もあるけどね。あいつら側から再度わざわざ非親告罪化とか言い出してるわけだし。
で、ここら辺からちょっと話がそれてきてるんだよね。イラストの話に、写真が入ってきてる。二次元画像の話じゃなくなってくる。あくまで話をイラストにとどまらせるのであれば「どこから実在でどこから非実在か」という話はするべきだと思うけど、ちょっと実在の写真がどうこうってなると手に負えないよねって話になってくる。じゃあ音声は?ChatGPTのような文章は?と、ここからどんどん話がずれてって、人類とAIみたいな話になりつつある…が、強硬に反AIを叫ぶ人たちは絵師とそのフォロワーしかいないのでした、と。今してるのはあくまでイラスト生成AIの話なもんで。なのでトランプ逮捕とかのディープフェイクなんかの話題も割愛
俺は普段NovelAIを使っていて、ここはDanbooruというイラスト専用サイトから学習しているらしいので写真は関係ないということでよろしく。これは「じゃあクリーンなデータなら受け入れるの?」っていう話でもあるね。
NovelAIは公式にDanbooruコンテンツで学習していることを明言している←で?何か問題ある?文句はNovelAIに言いなよ。もう学習は終了しちゃってるけどさ。さっきからずっと言ってるけど百歩譲って1ピクセルなんだよね。お気持ちでしかないよね
改めてイラストの画像生成AIの何がいけないのかがわからないなと思いました
ほんと反AIって表現規制に狂ったフェミナチみたいだよね。やってることまさしく表現規制だもん。1ピクセル分のお気持ちでしかないんだよね、自分は同人誌で他人の著作権侵害してるくせに自分は1ピクセルでも侵害されるのはいやだってお気持ち。本当は1ピクセルすらも侵害されてないくせに
今からでもフェミに土下座して宇崎のポスターの時みなさんのお気持ちに寄り添うことができずにすみませんでしたって謝ってこいよ
「生成AIによる民主化」を叫ぶパブコメが公開されて話題を呼び、「それは民主化ではなく共産化」という理解が急速に形成されている。この「民主化」という概念は何も9段の人物が考え出したものではなく、海外の生成AI議論、特にイラスト関連の議論では頻出の概念であり何らかの生成AI推進過激派の共通認識だが、一方で「共産化」は少なくとも増田は寡聞にして知らぬ。では、この「才能」の「民主化」とは何なのか? 恐らく国内で理解されている形では「極一部の『絵師』と呼ばれる特権階級が、生まれながらに持っている、『絵』を生成する技術」を「広く一般が使えるようにする」こと、だろう。
Financialization(金融化)という概念がある。1980年代から汎ゆるものを金銭的価値に換算する動きが加速し、万物が通貨によって交換できるようになる一方で、金融分野に加速度的に富が集中するようになってしまったとか、そんなような話だ。まあ安っぽいネオリベラリズム批判の一種と思って構わないが、このあらゆるものを金銭的価値と拡大の速度、加速度で考えるというプロ倫の延長線上にある思想は米国では広く一般に浸透している。
だから二次元業界も当然この金融化の対象として、森羅万象を四半期指標の伸びとして変換すべしという思想の中で解釈される。このものは素晴らしい、だから儲けを加速しなければならない、という自然な発想がある。二次元イラスト業界を金銭的な側面で発展させようという試みは、2010年代を通じて諸外国で繰り返されてきた。無断転載で客を集めた後、批判を浴びて版権元と交渉しようとした漫画村事件もその一部だし、同人誌の代理購入や転売が行われたり、無断翻訳グループや各種の転載サイトの有料サブスクが販売されたりとか、仮想通貨イラスト作家を巻き込む動きも見られたし、画像ファイルを集めて転売するとか、無料の3Dデータを改造して勝手に売るとか、あるいは無料で転載して名を上げるとか、色々な試みがあった。個々の作家に対してあなたの作品はもっとビッグな儲けに繋がる、価格を上げるべきだ、販売数を増やすべきだ、出版が難しければ顔だって繋ぐ、といったオファーが野放図に撃たれることもあった。
そのいずれにも日本の漫画業界、イラスト作家コミュニティは乗らなかった。日本は強固な「非営利の業界」を維持してきた。
日本人は日本の二次元業界が作り出すソフトパワーをまったく過小評価している。増田はある時、海外のイラストレーターが何だかのソフトの互換性問題で揉めている所を見たことがある。PSDはPhotoshopから出力されるとは限らない、俺はKritaを使っているし現場によってはCSPを使っているとか、どうだかだった。お前らはCSPが何のことか分かるか? Clip Studio Paintだ。増田にとってこれはちょっとした衝撃だった。まったくのサプライズド・ピカチュウだ。分かるか? 国産商用ソフトウェアがイラスト制作ソフトの世界的御三家の一角を固めていて、Adobeが三位なんだぞ。「日本にはジョブズが生まれない」?「日本製のソフトは通用しない」? いや、増田自身、普段はこれを言う方なのだが、それでもだ。かつてはbukkakeが世界一有名な日本語だとか、不名誉で恥ずかしいとか言われたものだが、今では所によってはblack company、mesugaki、menhera moveですら通じる(最後はどこかの初号機の貢献だ)。
そして、この継続的に世界に投射される存在感、その非営利思想(と、その裏でちゃんと行われているアニメやガチャゲー課金としての回収)は、思想的に原理主義的な低位のレイヤーにおいて、世界的に反発と軋轢を生み続けているのだ。
もう一つ説明すべきことがある。共産化とは何なのか? 帝政ロシア末期のそれにしろ、中国のそれにしろ、共産主義革命とは、力を持たない民衆が団結し、腐りきった既存の体制を打破し、特権階級が貪る既得権益を破壊し、人民に還元する、という建前で行われる営為だ。実際にはこの「特権階級」は中流層以下を指し、既得権益とは単に日常生活を指す、ということはまともな人間なら皆知っているだろう。高級な壺を割り水道を破壊し公共施設を打ち壊し電線を鋳潰し、全てを焼き払ってゴミにするのが共産化、共産主義革命である。社会を破壊して所有の概念を、いや「社会」と「モノ」という概念の終了を目指すのが共産主義である。
この「才能の民主化」と「それは共産化である」という批判はこれらを踏まえて解釈されなければならない。
「民主化」による恩恵を得るのはお前らではない。「お前ら」というのはブクマカや増田のような言葉を持つ人間だけに限ったものではない。日本人ではない。ここまで書いてきたように、いま、諸外国には、日本(または中韓台を含む極東アジア)人は二次元イラスト業界で特権的な地位を得、極端なダンピングと異常な反成長主義を敷いている、という怒りがある。その怒りの文脈において、日本人は全て二次元の絵を生成し享受できる特権階級であり、才能の共産主義革命において虐殺される対象である。⑨段のパブコメを書いた「生まれつき手が震えて線が引けない」者など同情に値するわけがない。絵の金融化、イラスト市場の資本主義的成長を阻害してきた旧来体制を賛美する、唾棄すべき特権階級である。ポル・ポト政権の新国家建設の呼びかけに喜び勇んでカンボジアへ舞い戻り人民裁判に掛けられ次々と虐殺された出稼ぎ労働者たちそのものの姿だ。
そしてその方法として、生成AI推進派たちは、Danbooruに(善意で)集積されたイラストを圧縮汎化させ任意に混ぜ合わせ薄めて取り出せるようにする。そのデータを配布し有象無象が使えるようにする。LoRAにより「絵柄」の神秘性を破壊し再現できるようにする。それらすべてはコンピュータの利用を強制して非属人的に実行されることで金銭的価値に還元される。
だからあれは共産化なのだ。だから「生成AIを規制するならば二次創作も規制しろ」なのだ。つまるところ「生成AIによる才能の民主化」の指すものは、金銭的価値への還元を断固として受け入れない二次元イラスト市場の破壊そのものなのだ。文化庁の連中が考えているような「『民主化』による、日本国内の広く一般の者への価値の還元」は発生しない。民主化AIで生産性を飛躍的に向上させたクリエイターの活躍などない。ソ連にまともな戦闘機がなかったようなものだ。仮にこれが「還元」だとするならば、起こるのはちょうど紙を高濃度の過酸化水素水で炎とガスに分解するような「還元」だ。「パブコメの知能が低すぎて困る」とかボヤいている場合ではない。それほどの、あえていえば低知能のもの、が反対一色に染まってパブリックコメントを送ってきているとはどういうことか? 実害を被っているのに他ならないではないか。
この話のオチは、恐らく「生成AIによる才能の民主化」が実際にこのまま進んだとて、著作権法がAIウォッシング無罪を規定したとて、それは絵の価値が下がるという一過性の日本の純損失であって、別に日本的なイラスト創作文化への参入が海外享受者たちに認められるわけではないだろうことだ。Twitter上でも指摘されていたが、AIに点滅するカレットを与えられないから絵が造れないなどという者はいないのだ。完璧な絵をプロンプトで定義できると言うならばしてみるがいい。いや、Twitter上でもなんでもいい、人は文字が読めるのだから、完璧な絵の定義を書けばそれは作品なのだ。件の人物が長々とコメントを書き、そしてバズりを作り出したように。
飽きた。ここで投げる事にする。ナガノのくまを讃えよ。
>「たとえ海賊版や個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。
>ですが仮に、ある漫画家が「海賊版サイトで漫画を読みまくって漫画を勉強しました」と発言したら、とうぶん仕事を失うでしょう。違法行為であるかは別として社会的、倫理的に許されない行為であることは明白だからです。
それは学習どうこう以前に、海賊版漫画をダウンロードすること自体が違法やんけ。
まさか未だに映画と音楽だけが違法だと思ってるのか? 2021年に漫画にも拡大されたぞ。
一方でアメリカにはフェアユースがあるので、Danbooruが倫理的に問題があるのか俺には分からん。
Google画像検索も無断転載と思われる画像が大量にヒットするしな。
そしてそこから学習したAIを使うことに問題があるのかはもっと分からん。
文化庁のAIと著作権についてのパブコメの結果が話題ですね。自分も2万件超のコメントの一つです。副業程度の収入を得ているアマチュア絵描きとして、生成AIには何らかの規制が必要であるという立場でコメントを送りました。
主要な問題としてコメントに書いたのが、生成AIの学習に海賊版(違法アップロードコンテンツ)が使われている問題です。
https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/hoseido/r05_07/pdf/94011401_01.pdf
文化庁PDFの30〜32ページに海賊版、つまり違法にアップロードされた書籍、写真、動画、絵などをAI学習に用いることについての意見が並んでいます。文化庁の見解としては、生成AI事業者が海賊版であると知ったうえでコンテンツを学習に用いた場合、事業者は権利侵害の責任を問われる可能性があるとの考え方のようです。
現行の生成AIは海賊版の学習なんてしているのか? 確実にしているようです。画像生成AIのひとつNovelAIが、海外の無断転載の温床であるDanbooruから学習していると公言したりとか、MetaがAI学習に使用したデータセットが膨大な海賊版書籍によるものだったとか、さまざまな話題があります。
もとより、ウェブには権利者に無断でアップされたもの(創作物だけでなく写真なども含む)が溢れかえっていることは周知の事実です。ウェブから効率よく膨大な学習データを求めれば、そうしたコンテンツが混ざってくることは当然なわけです。それを承知のうえで、生成AIの開発は行われている。
これはクリエイターや企業の著作権にとどまる問題ではありません。海外では、画像生成AIの学習データに児童ポルノや個人のプライバシーに関わる画像が含まれていることも指摘されています。自分の知らないところで自分の写った写真がウェブに放流されAIの学習対象になっている、ということもあるのです。
「たとえ海賊版や個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。
ですが仮に、ある漫画家が「海賊版サイトで漫画を読みまくって漫画を勉強しました」と発言したら、とうぶん仕事を失うでしょう。違法行為であるかは別として社会的、倫理的に許されない行為であることは明白だからです。
となれば、生成AIの学習に海賊版を用いることも同様に許されないでしょう(特に、AI肯定の立場から言われる「人間の学習とAIの学習は同じ」という見方ならば)。
クリエイターが、海賊版を学習したAIをそうと知って自身の創作に使うことは、間接的な海賊版の容認とも見なされるかもしれません。
非倫理的な学習方法によって成り立っているのが生成AIの現状です。批判的な立場からクリーンな学習データによるAIが求められるのはこのような理由もあるわけです。
残念なことに、生成AIを肯定・推進する立場の人々はこの学習データ問題に触れたがりません。自分の見てきた範囲ですが、本や記事やSNSで、ここに真摯に向き合っている人はいません。
「ディープフェイクや特定個人の模倣などの悪質なAIの使い方だけが問題だ」という主張をし、その範囲では厳しく批判をする人はいます。もちろん悪質な使い方は許されません。しかし、自身の使っている生成AIがその学習の成り立ちから非倫理的である可能性には触れません。認めると面倒なことになるのがわかっているからでしょう。
反発の声を都合よく切り取り、身勝手に新技術を忌避している反AIというくくりで片付け、本来の問題から目をそらしているのです。
生成AIの開発者も利用者も、まずこうした事実を認めて、横暴なやり方で莫大な学習データを確保し、その問題は無視して利便性のみで強引に生成AIを普及させているという現状に向きあうべきです。
学習データの無作為な広範さが、ディープフェイクなどの悪事を容易にし広めていることも認めないといけない。そこから改めて、あるべき生成AIのあり方を考えないといけません。
許可を得たクリーンな学習データのみを使用し、データの概要は開示すること、これが必要です。
AIの普及が避けられない、技術の進歩は止まらない、と言うのなら、その過程で誰かを踏みつけにしない努力も払うべきです。生成AIを批判する人の大半は、技術の発展に反対しているのではなくその過程の理不尽に反対しているのです。
danbooruタグは最初は膨大だなと思って見るが、何千枚と出力した時点で組み合わせパタンに限界が来る。
なによりポージングが飽きる。毎回少しずつ違うといっても、100枚ほど出力すると、同じポージングだなというのが見えてくる。
Controlnetでポージング変えられるというが、微調整にはいいが、崩れることが多く、モデルにないものは出せない。
プロンプトサイトがあるだろうというが、何ページにも渡ってプロンプトを探しても、似たりよったりで、新しいプロンプトに出会えない。
danbooruでタググループを一通り試したら、それ以上はないか、興味のないタグか、データが少ないかなのだ。
そしてChatGPTでプロンプトを作る道に移るが、danbooruタグで学習されているため、自然言語では出るには出るが、