はてなキーワード: danbooruとは
NovelAIのリークモデル(sd1.5)はSDXLの時代になって引き継げなくなったから打ち捨てられたよ。
違法転載サイトのDanbooruを学習元にしたモデルのリークモデルの再利用で既存の法律でも黒。
版権キャラの二次創作でも、明確にエロや生成AIを利用した生成を禁止している作品も被害にあっており規約的にも黒。
法的にクリーンな画像生成AIなんて、今現在、全く存在しないし、
違法な手段で研究・開発されたものの延長線上にある画像生成AIは違法性も引き継ぐ。
本当にゼロから新しく開発したならあるいはとは思うけど、結局犯罪行為にしか使われないし、
既存の技術を一切利用せず、ゼロから開発したと言う証明はできないので、クリーンになることはない。
「生成AIによる民主化」を叫ぶパブコメが公開されて話題を呼び、「それは民主化ではなく共産化」という理解が急速に形成されている。この「民主化」という概念は何も9段の人物が考え出したものではなく、海外の生成AI議論、特にイラスト関連の議論では頻出の概念であり何らかの生成AI推進過激派の共通認識だが、一方で「共産化」は少なくとも増田は寡聞にして知らぬ。では、この「才能」の「民主化」とは何なのか? 恐らく国内で理解されている形では「極一部の『絵師』と呼ばれる特権階級が、生まれながらに持っている、『絵』を生成する技術」を「広く一般が使えるようにする」こと、だろう。
Financialization(金融化)という概念がある。1980年代から汎ゆるものを金銭的価値に換算する動きが加速し、万物が通貨によって交換できるようになる一方で、金融分野に加速度的に富が集中するようになってしまったとか、そんなような話だ。まあ安っぽいネオリベラリズム批判の一種と思って構わないが、このあらゆるものを金銭的価値と拡大の速度、加速度で考えるというプロ倫の延長線上にある思想は米国では広く一般に浸透している。
だから二次元業界も当然この金融化の対象として、森羅万象を四半期指標の伸びとして変換すべしという思想の中で解釈される。このものは素晴らしい、だから儲けを加速しなければならない、という自然な発想がある。二次元イラスト業界を金銭的な側面で発展させようという試みは、2010年代を通じて諸外国で繰り返されてきた。無断転載で客を集めた後、批判を浴びて版権元と交渉しようとした漫画村事件もその一部だし、同人誌の代理購入や転売が行われたり、無断翻訳グループや各種の転載サイトの有料サブスクが販売されたりとか、仮想通貨イラスト作家を巻き込む動きも見られたし、画像ファイルを集めて転売するとか、無料の3Dデータを改造して勝手に売るとか、あるいは無料で転載して名を上げるとか、色々な試みがあった。個々の作家に対してあなたの作品はもっとビッグな儲けに繋がる、価格を上げるべきだ、販売数を増やすべきだ、出版が難しければ顔だって繋ぐ、といったオファーが野放図に撃たれることもあった。
そのいずれにも日本の漫画業界、イラスト作家コミュニティは乗らなかった。日本は強固な「非営利の業界」を維持してきた。
日本人は日本の二次元業界が作り出すソフトパワーをまったく過小評価している。増田はある時、海外のイラストレーターが何だかのソフトの互換性問題で揉めている所を見たことがある。PSDはPhotoshopから出力されるとは限らない、俺はKritaを使っているし現場によってはCSPを使っているとか、どうだかだった。お前らはCSPが何のことか分かるか? Clip Studio Paintだ。増田にとってこれはちょっとした衝撃だった。まったくのサプライズド・ピカチュウだ。分かるか? 国産商用ソフトウェアがイラスト制作ソフトの世界的御三家の一角を固めていて、Adobeが三位なんだぞ。「日本にはジョブズが生まれない」?「日本製のソフトは通用しない」? いや、増田自身、普段はこれを言う方なのだが、それでもだ。かつてはbukkakeが世界一有名な日本語だとか、不名誉で恥ずかしいとか言われたものだが、今では所によってはblack company、mesugaki、menhera moveですら通じる(最後はどこかの初号機の貢献だ)。
そして、この継続的に世界に投射される存在感、その非営利思想(と、その裏でちゃんと行われているアニメやガチャゲー課金としての回収)は、思想的に原理主義的な低位のレイヤーにおいて、世界的に反発と軋轢を生み続けているのだ。
もう一つ説明すべきことがある。共産化とは何なのか? 帝政ロシア末期のそれにしろ、中国のそれにしろ、共産主義革命とは、力を持たない民衆が団結し、腐りきった既存の体制を打破し、特権階級が貪る既得権益を破壊し、人民に還元する、という建前で行われる営為だ。実際にはこの「特権階級」は中流層以下を指し、既得権益とは単に日常生活を指す、ということはまともな人間なら皆知っているだろう。高級な壺を割り水道を破壊し公共施設を打ち壊し電線を鋳潰し、全てを焼き払ってゴミにするのが共産化、共産主義革命である。社会を破壊して所有の概念を、いや「社会」と「モノ」という概念の終了を目指すのが共産主義である。
この「才能の民主化」と「それは共産化である」という批判はこれらを踏まえて解釈されなければならない。
「民主化」による恩恵を得るのはお前らではない。「お前ら」というのはブクマカや増田のような言葉を持つ人間だけに限ったものではない。日本人ではない。ここまで書いてきたように、いま、諸外国には、日本(または中韓台を含む極東アジア)人は二次元イラスト業界で特権的な地位を得、極端なダンピングと異常な反成長主義を敷いている、という怒りがある。その怒りの文脈において、日本人は全て二次元の絵を生成し享受できる特権階級であり、才能の共産主義革命において虐殺される対象である。⑨段のパブコメを書いた「生まれつき手が震えて線が引けない」者など同情に値するわけがない。絵の金融化、イラスト市場の資本主義的成長を阻害してきた旧来体制を賛美する、唾棄すべき特権階級である。ポル・ポト政権の新国家建設の呼びかけに喜び勇んでカンボジアへ舞い戻り人民裁判に掛けられ次々と虐殺された出稼ぎ労働者たちそのものの姿だ。
そしてその方法として、生成AI推進派たちは、Danbooruに(善意で)集積されたイラストを圧縮汎化させ任意に混ぜ合わせ薄めて取り出せるようにする。そのデータを配布し有象無象が使えるようにする。LoRAにより「絵柄」の神秘性を破壊し再現できるようにする。それらすべてはコンピュータの利用を強制して非属人的に実行されることで金銭的価値に還元される。
だからあれは共産化なのだ。だから「生成AIを規制するならば二次創作も規制しろ」なのだ。つまるところ「生成AIによる才能の民主化」の指すものは、金銭的価値への還元を断固として受け入れない二次元イラスト市場の破壊そのものなのだ。文化庁の連中が考えているような「『民主化』による、日本国内の広く一般の者への価値の還元」は発生しない。民主化AIで生産性を飛躍的に向上させたクリエイターの活躍などない。ソ連にまともな戦闘機がなかったようなものだ。仮にこれが「還元」だとするならば、起こるのはちょうど紙を高濃度の過酸化水素水で炎とガスに分解するような「還元」だ。「パブコメの知能が低すぎて困る」とかボヤいている場合ではない。それほどの、あえていえば低知能のもの、が反対一色に染まってパブリックコメントを送ってきているとはどういうことか? 実害を被っているのに他ならないではないか。
この話のオチは、恐らく「生成AIによる才能の民主化」が実際にこのまま進んだとて、著作権法がAIウォッシング無罪を規定したとて、それは絵の価値が下がるという一過性の日本の純損失であって、別に日本的なイラスト創作文化への参入が海外享受者たちに認められるわけではないだろうことだ。Twitter上でも指摘されていたが、AIに点滅するカレットを与えられないから絵が造れないなどという者はいないのだ。完璧な絵をプロンプトで定義できると言うならばしてみるがいい。いや、Twitter上でもなんでもいい、人は文字が読めるのだから、完璧な絵の定義を書けばそれは作品なのだ。件の人物が長々とコメントを書き、そしてバズりを作り出したように。
飽きた。ここで投げる事にする。ナガノのくまを讃えよ。
すまんな
novelaiやろうとしてる奴みると出てくる発作だから気にせんといてや
はじめはdanbooru wikiとdanbooruの画像のタグ付けを見て欲しい要素を打ち込めばある程度思い通りにいくで
あとはちちぷいのnovelaiで検索して良いと思ったのをパクって開発すると楽しいで
がんばってな
ワンポイントアドバイス: novelai v3はartist名の指定が重要なんで先頭に置くとよい
ixyとかsuurin_(ksyaro)って入れるとガラッと絵が変わるんで試してみそ
昔作ってたケモR18プロンプトあるから参考にしてちょ(要品質向上プロンプト機能off)
ネガティブはけっこう使いまわしがきく
---
作家名, [very long hair], furry female, grey fur, sex, girl on top, naughty smile, in heat, :3, {fang}, looking back at viewer, arched back, body fur, sideboob, covered nipples, thighhighs, skirt lifted by tail, tail raised, pussy juice, breath, sweat, hair ornament, spoken heart, [wind], [[small breasts]], [penis,[cum in pussy], ejaculation], orgasm, [rating:Explicit, nsfw], {very aesthetic, best quality, highres}, [sunlight, palm tee, sky, cloud],
---
{copyright, copyright name, copyright notice, {bad hands}, signature, logo, text, comic}, lowres, {bad}, error, fewer, extra, missing, worst quality, jpeg artifacts, bad quality, watermark, unfinished, displeasing, chromatic aberration, extra digits, artistic error, username, scan, [abstract], {censored}, fox, letterboxed, anatomical nonsense, deformed, {{chibi}}, {blind, empty}, heterochromia, multiple views, pubic hair, bald, pawpads, paw gloves, animal feet, copyright, copyright notice, censor, censored
---
そこからかよ……
今の目玉のsdxlはロクに動かないだろうな
以前1660ti superでやってたが相当に辛かった(時間がかかりすぎてトライアンドエラーの気力が削がれる)
1. rtx3060 12gbを買う(確か4万くらい)
2. rtx4060ti 16gbを買う(確か7万くらい)
3. rtx4090を買う(確か30万くらい)
4. sdをあきらめてnovelaiのopusをやる(月間25$)
画像ai生成は楽しい/めんどくさいと感じるの、人によって違うんで
novelai使うなら要danbooru wiki トレーニングは基本danbooruのデータセットだから単語の効き方もそれになる
>「たとえ海賊版や個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。
>ですが仮に、ある漫画家が「海賊版サイトで漫画を読みまくって漫画を勉強しました」と発言したら、とうぶん仕事を失うでしょう。違法行為であるかは別として社会的、倫理的に許されない行為であることは明白だからです。
それは学習どうこう以前に、海賊版漫画をダウンロードすること自体が違法やんけ。
まさか未だに映画と音楽だけが違法だと思ってるのか? 2021年に漫画にも拡大されたぞ。
一方でアメリカにはフェアユースがあるので、Danbooruが倫理的に問題があるのか俺には分からん。
Google画像検索も無断転載と思われる画像が大量にヒットするしな。
そしてそこから学習したAIを使うことに問題があるのかはもっと分からん。
文化庁のAIと著作権についてのパブコメの結果が話題ですね。自分も2万件超のコメントの一つです。副業程度の収入を得ているアマチュア絵描きとして、生成AIには何らかの規制が必要であるという立場でコメントを送りました。
主要な問題としてコメントに書いたのが、生成AIの学習に海賊版(違法アップロードコンテンツ)が使われている問題です。
https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/hoseido/r05_07/pdf/94011401_01.pdf
文化庁PDFの30〜32ページに海賊版、つまり違法にアップロードされた書籍、写真、動画、絵などをAI学習に用いることについての意見が並んでいます。文化庁の見解としては、生成AI事業者が海賊版であると知ったうえでコンテンツを学習に用いた場合、事業者は権利侵害の責任を問われる可能性があるとの考え方のようです。
現行の生成AIは海賊版の学習なんてしているのか? 確実にしているようです。画像生成AIのひとつNovelAIが、海外の無断転載の温床であるDanbooruから学習していると公言したりとか、MetaがAI学習に使用したデータセットが膨大な海賊版書籍によるものだったとか、さまざまな話題があります。
もとより、ウェブには権利者に無断でアップされたもの(創作物だけでなく写真なども含む)が溢れかえっていることは周知の事実です。ウェブから効率よく膨大な学習データを求めれば、そうしたコンテンツが混ざってくることは当然なわけです。それを承知のうえで、生成AIの開発は行われている。
これはクリエイターや企業の著作権にとどまる問題ではありません。海外では、画像生成AIの学習データに児童ポルノや個人のプライバシーに関わる画像が含まれていることも指摘されています。自分の知らないところで自分の写った写真がウェブに放流されAIの学習対象になっている、ということもあるのです。
「たとえ海賊版や個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。
ですが仮に、ある漫画家が「海賊版サイトで漫画を読みまくって漫画を勉強しました」と発言したら、とうぶん仕事を失うでしょう。違法行為であるかは別として社会的、倫理的に許されない行為であることは明白だからです。
となれば、生成AIの学習に海賊版を用いることも同様に許されないでしょう(特に、AI肯定の立場から言われる「人間の学習とAIの学習は同じ」という見方ならば)。
クリエイターが、海賊版を学習したAIをそうと知って自身の創作に使うことは、間接的な海賊版の容認とも見なされるかもしれません。
非倫理的な学習方法によって成り立っているのが生成AIの現状です。批判的な立場からクリーンな学習データによるAIが求められるのはこのような理由もあるわけです。
残念なことに、生成AIを肯定・推進する立場の人々はこの学習データ問題に触れたがりません。自分の見てきた範囲ですが、本や記事やSNSで、ここに真摯に向き合っている人はいません。
「ディープフェイクや特定個人の模倣などの悪質なAIの使い方だけが問題だ」という主張をし、その範囲では厳しく批判をする人はいます。もちろん悪質な使い方は許されません。しかし、自身の使っている生成AIがその学習の成り立ちから非倫理的である可能性には触れません。認めると面倒なことになるのがわかっているからでしょう。
反発の声を都合よく切り取り、身勝手に新技術を忌避している反AIというくくりで片付け、本来の問題から目をそらしているのです。
生成AIの開発者も利用者も、まずこうした事実を認めて、横暴なやり方で莫大な学習データを確保し、その問題は無視して利便性のみで強引に生成AIを普及させているという現状に向きあうべきです。
学習データの無作為な広範さが、ディープフェイクなどの悪事を容易にし広めていることも認めないといけない。そこから改めて、あるべき生成AIのあり方を考えないといけません。
許可を得たクリーンな学習データのみを使用し、データの概要は開示すること、これが必要です。
AIの普及が避けられない、技術の進歩は止まらない、と言うのなら、その過程で誰かを踏みつけにしない努力も払うべきです。生成AIを批判する人の大半は、技術の発展に反対しているのではなくその過程の理不尽に反対しているのです。
danbooruタグは最初は膨大だなと思って見るが、何千枚と出力した時点で組み合わせパタンに限界が来る。
なによりポージングが飽きる。毎回少しずつ違うといっても、100枚ほど出力すると、同じポージングだなというのが見えてくる。
Controlnetでポージング変えられるというが、微調整にはいいが、崩れることが多く、モデルにないものは出せない。
プロンプトサイトがあるだろうというが、何ページにも渡ってプロンプトを探しても、似たりよったりで、新しいプロンプトに出会えない。
danbooruでタググループを一通り試したら、それ以上はないか、興味のないタグか、データが少ないかなのだ。
そしてChatGPTでプロンプトを作る道に移るが、danbooruタグで学習されているため、自然言語では出るには出るが、
非クリエイター、画像生成AI(stable diffusion web ui)に触れている(投稿は一切していない)だけの消費者のただのお気持ち投稿です。(反AI寄りです)
また全体的に画像生成AIを批判する内容ですが、画像生成AIを使って画像を投稿している人や記事を書いてる人や金儲けをしている人に突撃するような活動はさすがにダメだと思っています(クマを殺すなと市役所に電凸するようなものと同じと思ってるので)
昨今画像生成AIによる作品が大量に発生してきているためものすごくげんなりしています。DMMやDLsite等を利用している人であれば実感している人が居ると思いますが、これでもかってくらいAIによる生成物が増えてきて明らかに特定の作者まんまの作品がちらほら・・・。また、画像生成AIの進歩が凄いというのを実感する一方でその発信をする人の中に時々pixivのファンイラストの無断使用するとかMMDのモーションをAIでパクっただけ等とAIと関係なく著作権の意識が希薄な人が居てせっかくの技術もこんな使われ方されてかわいそうって思います。
とはいえ、さすがにAIを触る人間の大半がそんな人間ではないだろうとも思ってはいます。賢木イオ氏がアンケートを採った「狙い撃ちLoRAや絵柄模倣、貴方はどう思う?画像生成AIユーザー緊急アンケート」の記事内でも「特定絵師さんの画風再現AI絵」を問題ないと思っているのは1割でアンケートの回答者に関しても世間が「AI絵師」と呼ぶような投稿者は4人に1人以下というものでした。直感的にもそんなものだろうとは思いつつ、画像生成AIの界隈はところどころ不穏な層が結構目立つ。イラストレーターに対して画像を学習したことを直接報告する人とかおそらく犯罪にならないからと反AI層にイキリ散らかすのとか。そんなのがいるもんだからAI推進派の目立つ人(その中でも話が通じる人・まともな人)に粘着したり殺害予告やらと反AIの過激な人も現れていてSNSでは建設的な議論よりもひたすら誹謗中傷ばかり増えて本当に見ていてきついです。
直観的な感覚としては、特定のイラストレーターのデータを学習した上でそのイラストレーターと似たような絵を作成して販売したら著作権の侵害になるのでは?と感じるのだがどうもそうはいかないというのが昨今の流れのようです。
軽く調べただけですが理由として
・著作権の侵害には「類似性」と「依拠性」の“両方“を満たす必要がある
・AI学習そのものは原則として著作権者の許諾なく行うことが可能(権利制限規定として)
といったことがだいたいあげられるのだが
・30条の4には「著作権者の利益を不当に害することとなる場合は、この限りでない。」との但し書きも存在しているため営利的に活動する場合は果たして?
・イラストや同人誌は二次創作の範囲内としてグレーな扱いになるが、グッズの販売はAI関係なく以前から書類送検されている例もあるのでAIだからセーフ論は特に立体物では通じないのでは?
とも思った。
とはいえ中々すっきりしない理由としておそらくは参照すべき背景や歴史や法律の運用等々があるのだろうとも推察されるので素人が口出ししないほうがいいような気もしました。特にAI絵師に「著作権法違反だ!」とかみつくようなものは。トレパク告発もそうですがお前は●●だといった断定するような批判は「真実であろうと冤罪であろうと名誉毀損」になりうるので、問題と思うのなら部外者は違法性が高いと考えうる証拠を保存するだけに留めるのが賢明でしょう。(よく知らない人物に突撃する人がそういった行動をとれるかは微妙ですが)
画像を生成したことでわかったこととして大きかったのが、生成されたまま投稿されたAI生成物(というかただの手抜き)がどんなモデルだったりLoraだったりプロンプトで作られているのか少し予想できるようになりました(私に限らず少しでも画像生成AIに触った人はだいたいできるでしょうが)。そこからまあまあの割合の人は自分と大差ないかそれ以下のレベルに収まっており、私のような人間はあくまでも画像を生成できるサービスを利用している消費者に過ぎないということも実感しました。
また画像投稿サイト「Danbooru」からデータを取り込んでいるとして話題のNovelAIだったりMidjourneyだったりdall-e 3等含めていくつも画像生成AIのサービスが現時点で存在していますが、生成AIを批判している人の中にはこれらの区別がつかない人がまあまあいてなんだかなと思います。複数のサービスに触るとそれぞれのツールが抱える問題と画像生成AI全般における問題を多少は区別して考えられるようにはなるのかなと。
一番大事だと思うこととして「苦手」と言われていた表現のだいたいが数か月したら「可能~かなりいい出来」のクオリティまで引き上げられていることがたくさんあることをリアルタイムで感じることができます。なので画像生成AIが作れない画像がまあまああるというイメージが最初のころはありましたが、今はおそらくほぼ大体の画像を作成できるようになると私は確信しています(画像データの絶対数が少ないものを正確に作る等は苦手なままと予測していますが)。
まず現時点で画像生成AIはパソコンさえあれば元手0円でできるということと、犯罪者としておそらく逮捕されず年間数百万や数千万稼げるというのが完全に嘘ではないというところが厄介と言わざる得ません。好きな漫画家やイラストレーターがいる人間からすると倫理的にどう考えてもダメなのでは・・・・・と感じますが、正直なところ自分も定職に就けず碌な稼ぎを得ることもままならない状況だったらマネタイズに手をだした可能性が非常に高いと思います。
とはいえ、最近のDMMやDLsiteを少しでも眺めている人はわかるでしょうが作成した画像をただ並べた画像集はさすがに売れないようになっているようです。今年の4月ぐらいであれば画像を並べただけでも1000個は販売できたような入れ食い状態でしたが、最近ではその程度では1桁がいいところのようです。とは言うものの11月12月発売の作品でも数千個の売り上げがある作品もまだまだあって、そういう作品はだいたい生成されたものに加筆+セリフ追加+サムネイルを目立たせる といった売れるための努力をしています。作品の絶対数が増え、クオリティの差が目立ってきたことでとりあえず生成AIを使えるだけのレベルに収まっている人は淘汰されていっているということでしょう。されどAIを使って画像を出力するだけで多額の金銭を得ることになれた人が黙って引退するわけもないのでどうにかして利益をひねり出そうと手を変え品を変えガワや看板や提供の仕方を変えて利益を得ようを頑張っているのでどんどん殺伐としてきてますね。本当に。
なにはともあれ「資格」「専門的な知識・教育」「経歴」を必要とせず労力と時間をかけた分だけ金銭が得られる可能性が高い分野はそうそう存在しないため現時点で数百万・数千万の利益を得ているような人からすればAIの規制は死活問題です。どうにかして自分の利益を守ろうとするならAIが著作権違反じゃないと無理のある理由をつけてでも喧伝するのも自然な流れでしょう。
せめて現行法で十分対応できる範囲のものはやってほしいところです。さそりがため先生がトレパク常習犯を刑事訴追した例もありますし、AIだからセーフを信じて過激な行動をしている人に対してはそろそろ何かしらの対応がされてもいいんじゃないかなと期待しています。そもそもAIが登場する以前でも逮捕される様な行動はAI関係なくアウトなはずでは?とは思ってるんですがね。そのうえで非常に大事なことですが、AIを使っているだけの人に殺害予告したりとか犯罪者呼ばわりしたりするのは本当に止めましょう。普通に開示請求通って損害賠償請求までいくので。またAIで俺の絵をパクっただろ系のやつも画像生成した本人が自慢している場合以外はやめましょう。さそりがため先生みたいに明らかにトレパクされているレベルでも刑事訴追まで数年かかってるので立証自体が難しいのと、既に言及してますが真実であっても間違いであっても名誉棄損になりそうなので。
・自分が作成していないものを自分の手書き・撮影したものと偽る
・なんならタイトル以外の文章まるごと自分のものとして投稿する(テラーノベルが無断転載の温床になってましたね)
・本来モザイクがかかっている画像のモザイクを外した画像をだす
といったことをしていた人はAI以前から存在していた。AIは単に自力ではこういったことができないからやらなかった人が行動を起こすための敷居を大きく下げたに過ぎないのではと私は考えています。世の中にはまあまあの数の人が労力と利益に対して罰則や失うものが多いために犯罪や犯罪じゃないが良くないことを実行していないだけで、今回のAIによって労力が限りなく0に下がり一方で得られる利益(金銭だったりネットで話題になる、注目される)が上がってしまった。加えて逮捕されるリスクも低い(そう言われているだけで実際にそうかは別)と言われたら犯罪者未満~一般人程度に含まれる人がこぞって暴れ始めたのだろう。文化庁含め画像生成AIにおける著作権の問題が各地で巻き起こっているけども、「簡単にできるが逮捕されない」ということを信じて行動する人がたくさんいることをどうにかしないと何も変わらないと思います。今はまだそれなりのパソコンを使っての作成や有料
サービスを利用しての画像生成が主流ですが、スマホでの作成が主流になれば今よりも酷いものになるでしょう。
そのためにも犯罪行為をしたらちゃんと逮捕されるという当たり前の事実を徹底的に広め・認識させるしかないでしょう。