はてなキーワード: Danbooruとは
画像生成AIは何が問題なのか?というwikiを見て頭のほうにいろいろ書いてあったけどさhttps://w.atwiki.jp/genai_problem/pages/10.html#id_c770cabd
もともとネットに落ちてた画像って公開情報でしょ?それを元に学習して何が問題あるの?
もともとはんこ絵と呼ばれていたイラストを学習して新たなイラストを生成することの何が問題なのか
学習もとへの還元がない←必要ない。お前の絵の要素が俺の生成した絵に何かしらの影響与えてたとして、1ピクセルぐらいのもんだろ。これ百歩譲って画像生成AIが何かしらのコラージュを作るような機械だった場合の話であって、そもそもコラージュを作る機械ではない
学習元が作った成果物によって、学習元の市場と競合する存在になりえる。←知らん。そもそも1ピクセルで大げさに騒ぎすぎ。こういう「我々は被害にあった、犠牲になった」みたいな大げさな態度とるくせに自分はちゃっかり二次創作で他人の著作権侵害して金もらってるそのダブスタどうにかしろ
学習元の模倣による類似品が容易に製作できる。←知らん。個別に現行の著作権法で対応すればいい。念のために言っておくが画風や絵柄に著作権はない
生成スピードが早く、類似品を出すことが容易なため、表現の陳腐化も早い。←知らん。どうでもいい
生成スピードが早いために、プラットフォームへの投稿速度、量ともに尋常ではない。←ま、ちょっとわかる。けど、マスピ顔も過去のものとなり客にも「結局抜ければ何でもいい」と言われ始めているし、今後質が上がるのならそもそも別に悪いこととは思わない。後はプラットフォームの運営の考え方次第
i2iやControlNetをはじめとする技術によって、盗作が容易であるとともに証明する事が困難。←画風や絵柄に著作権がない上で何をもって盗作と認定しているのか。フェミ同様推定無罪の考え方を放棄しているように見える
とりあえずざっくり大見出しだけ論破した。その他「どうでもいい」だけじゃ足りなさそうな小見出しを論破していく
生産者減少に伴う産業の衰退←Xでは画像を学習させると明言しているにもかかわらず今でも普通に絵が流れてくる。俺は結局絵を描くことが好きな奴は絵を描くことをやめれないんだと思うよ。描いて、それを人に見せたいから学習されると知りながらもネットに上げる。「絵を描いてちやほやされたい」だけの人は筆を折るだろうが、「そもそも絵を描くこと自体が好き」という人は学習されようが描いてネットに上げるんだと思うね。それが何年続くかは知らないが。結局は消費者ってのは絵の美麗さもそうだが、絵に宿る精神を消費してるわけで、その精神ってのは手書きだろうとデジタルだろうとAIだろうと宿るんだよね。俺は超有名な絵師の絵柄割って、本人が絶対に作らないであろう変態ドエロ画像を生成しているんだけど、本人には俺の精神がないからそんな画像を作り出すことはできないし、逆もしかりなんだよね。「こういうのいいよね」っていう世間へのプレゼン、今までは絵師しかできてなかったけど一般人もできるようになったっていう。そういうプレゼンの手法としてどれを取るかという話で、AIが発展しても絵を描く人間はいなくならないと思ってるね。デジタルが出てきてもアナログで描いてるやつ消えてないように
児童ポルノ問題←リアル描写のAI製児童ポルノに関しては俺は見たくないが、二次元キャラの非実在児童ポルノなんてのは日本にはありふれていて、むしろそういうのを守るためにオタクたちは一致団結してたんじゃないの?非実在なんで~とか18歳以上の設定なんで~ロリババアなんで~とかやってたわけじゃん。ここは確かにちょっと問題を孕んではいるが、どこから実在でどこから非実在かという部分を慎重に議論しなきゃいけんと思うけどね。反AI原理主義はもはやフェミもびっくりの表現規制派と化しているので「非実在だろうが児童ポルノはNG」とか平気でかましてくる可能性もあるけどね。あいつら側から再度わざわざ非親告罪化とか言い出してるわけだし。
で、ここら辺からちょっと話がそれてきてるんだよね。イラストの話に、写真が入ってきてる。二次元画像の話じゃなくなってくる。あくまで話をイラストにとどまらせるのであれば「どこから実在でどこから非実在か」という話はするべきだと思うけど、ちょっと実在の写真がどうこうってなると手に負えないよねって話になってくる。じゃあ音声は?ChatGPTのような文章は?と、ここからどんどん話がずれてって、人類とAIみたいな話になりつつある…が、強硬に反AIを叫ぶ人たちは絵師とそのフォロワーしかいないのでした、と。今してるのはあくまでイラスト生成AIの話なもんで。なのでトランプ逮捕とかのディープフェイクなんかの話題も割愛
俺は普段NovelAIを使っていて、ここはDanbooruというイラスト専用サイトから学習しているらしいので写真は関係ないということでよろしく。これは「じゃあクリーンなデータなら受け入れるの?」っていう話でもあるね。
NovelAIは公式にDanbooruコンテンツで学習していることを明言している←で?何か問題ある?文句はNovelAIに言いなよ。もう学習は終了しちゃってるけどさ。さっきからずっと言ってるけど百歩譲って1ピクセルなんだよね。お気持ちでしかないよね
改めてイラストの画像生成AIの何がいけないのかがわからないなと思いました
ほんと反AIって表現規制に狂ったフェミナチみたいだよね。やってることまさしく表現規制だもん。1ピクセル分のお気持ちでしかないんだよね、自分は同人誌で他人の著作権侵害してるくせに自分は1ピクセルでも侵害されるのはいやだってお気持ち。本当は1ピクセルすらも侵害されてないくせに
今からでもフェミに土下座して宇崎のポスターの時みなさんのお気持ちに寄り添うことができずにすみませんでしたって謝ってこいよ
NovelAIのリークモデル(sd1.5)はSDXLの時代になって引き継げなくなったから打ち捨てられたよ。
違法転載サイトのDanbooruを学習元にしたモデルのリークモデルの再利用で既存の法律でも黒。
版権キャラの二次創作でも、明確にエロや生成AIを利用した生成を禁止している作品も被害にあっており規約的にも黒。
法的にクリーンな画像生成AIなんて、今現在、全く存在しないし、
違法な手段で研究・開発されたものの延長線上にある画像生成AIは違法性も引き継ぐ。
本当にゼロから新しく開発したならあるいはとは思うけど、結局犯罪行為にしか使われないし、
既存の技術を一切利用せず、ゼロから開発したと言う証明はできないので、クリーンになることはない。
「生成AIによる民主化」を叫ぶパブコメが公開されて話題を呼び、「それは民主化ではなく共産化」という理解が急速に形成されている。この「民主化」という概念は何も9段の人物が考え出したものではなく、海外の生成AI議論、特にイラスト関連の議論では頻出の概念であり何らかの生成AI推進過激派の共通認識だが、一方で「共産化」は少なくとも増田は寡聞にして知らぬ。では、この「才能」の「民主化」とは何なのか? 恐らく国内で理解されている形では「極一部の『絵師』と呼ばれる特権階級が、生まれながらに持っている、『絵』を生成する技術」を「広く一般が使えるようにする」こと、だろう。
Financialization(金融化)という概念がある。1980年代から汎ゆるものを金銭的価値に換算する動きが加速し、万物が通貨によって交換できるようになる一方で、金融分野に加速度的に富が集中するようになってしまったとか、そんなような話だ。まあ安っぽいネオリベラリズム批判の一種と思って構わないが、このあらゆるものを金銭的価値と拡大の速度、加速度で考えるというプロ倫の延長線上にある思想は米国では広く一般に浸透している。
だから二次元業界も当然この金融化の対象として、森羅万象を四半期指標の伸びとして変換すべしという思想の中で解釈される。このものは素晴らしい、だから儲けを加速しなければならない、という自然な発想がある。二次元イラスト業界を金銭的な側面で発展させようという試みは、2010年代を通じて諸外国で繰り返されてきた。無断転載で客を集めた後、批判を浴びて版権元と交渉しようとした漫画村事件もその一部だし、同人誌の代理購入や転売が行われたり、無断翻訳グループや各種の転載サイトの有料サブスクが販売されたりとか、仮想通貨イラスト作家を巻き込む動きも見られたし、画像ファイルを集めて転売するとか、無料の3Dデータを改造して勝手に売るとか、あるいは無料で転載して名を上げるとか、色々な試みがあった。個々の作家に対してあなたの作品はもっとビッグな儲けに繋がる、価格を上げるべきだ、販売数を増やすべきだ、出版が難しければ顔だって繋ぐ、といったオファーが野放図に撃たれることもあった。
そのいずれにも日本の漫画業界、イラスト作家コミュニティは乗らなかった。日本は強固な「非営利の業界」を維持してきた。
日本人は日本の二次元業界が作り出すソフトパワーをまったく過小評価している。増田はある時、海外のイラストレーターが何だかのソフトの互換性問題で揉めている所を見たことがある。PSDはPhotoshopから出力されるとは限らない、俺はKritaを使っているし現場によってはCSPを使っているとか、どうだかだった。お前らはCSPが何のことか分かるか? Clip Studio Paintだ。増田にとってこれはちょっとした衝撃だった。まったくのサプライズド・ピカチュウだ。分かるか? 国産商用ソフトウェアがイラスト制作ソフトの世界的御三家の一角を固めていて、Adobeが三位なんだぞ。「日本にはジョブズが生まれない」?「日本製のソフトは通用しない」? いや、増田自身、普段はこれを言う方なのだが、それでもだ。かつてはbukkakeが世界一有名な日本語だとか、不名誉で恥ずかしいとか言われたものだが、今では所によってはblack company、mesugaki、menhera moveですら通じる(最後はどこかの初号機の貢献だ)。
そして、この継続的に世界に投射される存在感、その非営利思想(と、その裏でちゃんと行われているアニメやガチャゲー課金としての回収)は、思想的に原理主義的な低位のレイヤーにおいて、世界的に反発と軋轢を生み続けているのだ。
もう一つ説明すべきことがある。共産化とは何なのか? 帝政ロシア末期のそれにしろ、中国のそれにしろ、共産主義革命とは、力を持たない民衆が団結し、腐りきった既存の体制を打破し、特権階級が貪る既得権益を破壊し、人民に還元する、という建前で行われる営為だ。実際にはこの「特権階級」は中流層以下を指し、既得権益とは単に日常生活を指す、ということはまともな人間なら皆知っているだろう。高級な壺を割り水道を破壊し公共施設を打ち壊し電線を鋳潰し、全てを焼き払ってゴミにするのが共産化、共産主義革命である。社会を破壊して所有の概念を、いや「社会」と「モノ」という概念の終了を目指すのが共産主義である。
この「才能の民主化」と「それは共産化である」という批判はこれらを踏まえて解釈されなければならない。
「民主化」による恩恵を得るのはお前らではない。「お前ら」というのはブクマカや増田のような言葉を持つ人間だけに限ったものではない。日本人ではない。ここまで書いてきたように、いま、諸外国には、日本(または中韓台を含む極東アジア)人は二次元イラスト業界で特権的な地位を得、極端なダンピングと異常な反成長主義を敷いている、という怒りがある。その怒りの文脈において、日本人は全て二次元の絵を生成し享受できる特権階級であり、才能の共産主義革命において虐殺される対象である。⑨段のパブコメを書いた「生まれつき手が震えて線が引けない」者など同情に値するわけがない。絵の金融化、イラスト市場の資本主義的成長を阻害してきた旧来体制を賛美する、唾棄すべき特権階級である。ポル・ポト政権の新国家建設の呼びかけに喜び勇んでカンボジアへ舞い戻り人民裁判に掛けられ次々と虐殺された出稼ぎ労働者たちそのものの姿だ。
そしてその方法として、生成AI推進派たちは、Danbooruに(善意で)集積されたイラストを圧縮汎化させ任意に混ぜ合わせ薄めて取り出せるようにする。そのデータを配布し有象無象が使えるようにする。LoRAにより「絵柄」の神秘性を破壊し再現できるようにする。それらすべてはコンピュータの利用を強制して非属人的に実行されることで金銭的価値に還元される。
だからあれは共産化なのだ。だから「生成AIを規制するならば二次創作も規制しろ」なのだ。つまるところ「生成AIによる才能の民主化」の指すものは、金銭的価値への還元を断固として受け入れない二次元イラスト市場の破壊そのものなのだ。文化庁の連中が考えているような「『民主化』による、日本国内の広く一般の者への価値の還元」は発生しない。民主化AIで生産性を飛躍的に向上させたクリエイターの活躍などない。ソ連にまともな戦闘機がなかったようなものだ。仮にこれが「還元」だとするならば、起こるのはちょうど紙を高濃度の過酸化水素水で炎とガスに分解するような「還元」だ。「パブコメの知能が低すぎて困る」とかボヤいている場合ではない。それほどの、あえていえば低知能のもの、が反対一色に染まってパブリックコメントを送ってきているとはどういうことか? 実害を被っているのに他ならないではないか。
この話のオチは、恐らく「生成AIによる才能の民主化」が実際にこのまま進んだとて、著作権法がAIウォッシング無罪を規定したとて、それは絵の価値が下がるという一過性の日本の純損失であって、別に日本的なイラスト創作文化への参入が海外享受者たちに認められるわけではないだろうことだ。Twitter上でも指摘されていたが、AIに点滅するカレットを与えられないから絵が造れないなどという者はいないのだ。完璧な絵をプロンプトで定義できると言うならばしてみるがいい。いや、Twitter上でもなんでもいい、人は文字が読めるのだから、完璧な絵の定義を書けばそれは作品なのだ。件の人物が長々とコメントを書き、そしてバズりを作り出したように。
飽きた。ここで投げる事にする。ナガノのくまを讃えよ。
すまんな
novelaiやろうとしてる奴みると出てくる発作だから気にせんといてや
はじめはdanbooru wikiとdanbooruの画像のタグ付けを見て欲しい要素を打ち込めばある程度思い通りにいくで
あとはちちぷいのnovelaiで検索して良いと思ったのをパクって開発すると楽しいで
がんばってな
ワンポイントアドバイス: novelai v3はartist名の指定が重要なんで先頭に置くとよい
ixyとかsuurin_(ksyaro)って入れるとガラッと絵が変わるんで試してみそ
昔作ってたケモR18プロンプトあるから参考にしてちょ(要品質向上プロンプト機能off)
ネガティブはけっこう使いまわしがきく
---
作家名, [very long hair], furry female, grey fur, sex, girl on top, naughty smile, in heat, :3, {fang}, looking back at viewer, arched back, body fur, sideboob, covered nipples, thighhighs, skirt lifted by tail, tail raised, pussy juice, breath, sweat, hair ornament, spoken heart, [wind], [[small breasts]], [penis,[cum in pussy], ejaculation], orgasm, [rating:Explicit, nsfw], {very aesthetic, best quality, highres}, [sunlight, palm tee, sky, cloud],
---
{copyright, copyright name, copyright notice, {bad hands}, signature, logo, text, comic}, lowres, {bad}, error, fewer, extra, missing, worst quality, jpeg artifacts, bad quality, watermark, unfinished, displeasing, chromatic aberration, extra digits, artistic error, username, scan, [abstract], {censored}, fox, letterboxed, anatomical nonsense, deformed, {{chibi}}, {blind, empty}, heterochromia, multiple views, pubic hair, bald, pawpads, paw gloves, animal feet, copyright, copyright notice, censor, censored
---
そこからかよ……
今の目玉のsdxlはロクに動かないだろうな
以前1660ti superでやってたが相当に辛かった(時間がかかりすぎてトライアンドエラーの気力が削がれる)
1. rtx3060 12gbを買う(確か4万くらい)
2. rtx4060ti 16gbを買う(確か7万くらい)
3. rtx4090を買う(確か30万くらい)
4. sdをあきらめてnovelaiのopusをやる(月間25$)
画像ai生成は楽しい/めんどくさいと感じるの、人によって違うんで
novelai使うなら要danbooru wiki トレーニングは基本danbooruのデータセットだから単語の効き方もそれになる
>「たとえ海賊版や個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。
>ですが仮に、ある漫画家が「海賊版サイトで漫画を読みまくって漫画を勉強しました」と発言したら、とうぶん仕事を失うでしょう。違法行為であるかは別として社会的、倫理的に許されない行為であることは明白だからです。
それは学習どうこう以前に、海賊版漫画をダウンロードすること自体が違法やんけ。
まさか未だに映画と音楽だけが違法だと思ってるのか? 2021年に漫画にも拡大されたぞ。
一方でアメリカにはフェアユースがあるので、Danbooruが倫理的に問題があるのか俺には分からん。
Google画像検索も無断転載と思われる画像が大量にヒットするしな。
そしてそこから学習したAIを使うことに問題があるのかはもっと分からん。
文化庁のAIと著作権についてのパブコメの結果が話題ですね。自分も2万件超のコメントの一つです。副業程度の収入を得ているアマチュア絵描きとして、生成AIには何らかの規制が必要であるという立場でコメントを送りました。
主要な問題としてコメントに書いたのが、生成AIの学習に海賊版(違法アップロードコンテンツ)が使われている問題です。
https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/hoseido/r05_07/pdf/94011401_01.pdf
文化庁PDFの30〜32ページに海賊版、つまり違法にアップロードされた書籍、写真、動画、絵などをAI学習に用いることについての意見が並んでいます。文化庁の見解としては、生成AI事業者が海賊版であると知ったうえでコンテンツを学習に用いた場合、事業者は権利侵害の責任を問われる可能性があるとの考え方のようです。
現行の生成AIは海賊版の学習なんてしているのか? 確実にしているようです。画像生成AIのひとつNovelAIが、海外の無断転載の温床であるDanbooruから学習していると公言したりとか、MetaがAI学習に使用したデータセットが膨大な海賊版書籍によるものだったとか、さまざまな話題があります。
もとより、ウェブには権利者に無断でアップされたもの(創作物だけでなく写真なども含む)が溢れかえっていることは周知の事実です。ウェブから効率よく膨大な学習データを求めれば、そうしたコンテンツが混ざってくることは当然なわけです。それを承知のうえで、生成AIの開発は行われている。
これはクリエイターや企業の著作権にとどまる問題ではありません。海外では、画像生成AIの学習データに児童ポルノや個人のプライバシーに関わる画像が含まれていることも指摘されています。自分の知らないところで自分の写った写真がウェブに放流されAIの学習対象になっている、ということもあるのです。
「たとえ海賊版や個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。
ですが仮に、ある漫画家が「海賊版サイトで漫画を読みまくって漫画を勉強しました」と発言したら、とうぶん仕事を失うでしょう。違法行為であるかは別として社会的、倫理的に許されない行為であることは明白だからです。
となれば、生成AIの学習に海賊版を用いることも同様に許されないでしょう(特に、AI肯定の立場から言われる「人間の学習とAIの学習は同じ」という見方ならば)。
クリエイターが、海賊版を学習したAIをそうと知って自身の創作に使うことは、間接的な海賊版の容認とも見なされるかもしれません。
非倫理的な学習方法によって成り立っているのが生成AIの現状です。批判的な立場からクリーンな学習データによるAIが求められるのはこのような理由もあるわけです。
残念なことに、生成AIを肯定・推進する立場の人々はこの学習データ問題に触れたがりません。自分の見てきた範囲ですが、本や記事やSNSで、ここに真摯に向き合っている人はいません。
「ディープフェイクや特定個人の模倣などの悪質なAIの使い方だけが問題だ」という主張をし、その範囲では厳しく批判をする人はいます。もちろん悪質な使い方は許されません。しかし、自身の使っている生成AIがその学習の成り立ちから非倫理的である可能性には触れません。認めると面倒なことになるのがわかっているからでしょう。
反発の声を都合よく切り取り、身勝手に新技術を忌避している反AIというくくりで片付け、本来の問題から目をそらしているのです。
生成AIの開発者も利用者も、まずこうした事実を認めて、横暴なやり方で莫大な学習データを確保し、その問題は無視して利便性のみで強引に生成AIを普及させているという現状に向きあうべきです。
学習データの無作為な広範さが、ディープフェイクなどの悪事を容易にし広めていることも認めないといけない。そこから改めて、あるべき生成AIのあり方を考えないといけません。
許可を得たクリーンな学習データのみを使用し、データの概要は開示すること、これが必要です。
AIの普及が避けられない、技術の進歩は止まらない、と言うのなら、その過程で誰かを踏みつけにしない努力も払うべきです。生成AIを批判する人の大半は、技術の発展に反対しているのではなくその過程の理不尽に反対しているのです。