はてなキーワード: danbooruとは
すまんな
novelaiやろうとしてる奴みると出てくる発作だから気にせんといてや
はじめはdanbooru wikiとdanbooruの画像のタグ付けを見て欲しい要素を打ち込めばある程度思い通りにいくで
あとはちちぷいのnovelaiで検索して良いと思ったのをパクって開発すると楽しいで
がんばってな
ワンポイントアドバイス: novelai v3はartist名の指定が重要なんで先頭に置くとよい
ixyとかsuurin_(ksyaro)って入れるとガラッと絵が変わるんで試してみそ
昔作ってたケモR18プロンプトあるから参考にしてちょ(要品質向上プロンプト機能off)
ネガティブはけっこう使いまわしがきく
---
rimukoro, [very long hair], furry female, grey fur, sex, girl on top, naughty smile, in heat, :3, {fang}, looking back at viewer, arched back, body fur, sideboob, covered nipples, thighhighs, skirt lifted by tail, tail raised, pussy juice, breath, sweat, hair ornament, spoken heart, [wind], [[small breasts]], [penis,[cum in pussy], ejaculation], orgasm, [rating:Explicit, nsfw], {very aesthetic, best quality, highres}, [sunlight, palm tee, sky, cloud],
---
{copyright, copyright name, copyright notice, {bad hands}, signature, logo, text, comic}, lowres, {bad}, error, fewer, extra, missing, worst quality, jpeg artifacts, bad quality, watermark, unfinished, displeasing, chromatic aberration, extra digits, artistic error, username, scan, [abstract], {censored}, fox, letterboxed, anatomical nonsense, deformed, {{chibi}}, {blind, empty}, heterochromia, multiple views, pubic hair, bald, pawpads, paw gloves, animal feet, copyright, copyright notice, censor, censored
---
そこからかよ……
今の目玉のsdxlはロクに動かないだろうな
以前1660ti superでやってたが相当に辛かった(時間がかかりすぎてトライアンドエラーの気力が削がれる)
1. rtx3060 12gbを買う(確か4万くらい)
2. rtx4060ti 16gbを買う(確か7万くらい)
3. rtx4090を買う(確か30万くらい)
4. sdをあきらめてnovelaiのopusをやる(月間25$)
画像ai生成は楽しい/めんどくさいと感じるの、人によって違うんで
novelai使うなら要danbooru wiki トレーニングは基本danbooruのデータセットだから単語の効き方もそれになる
>「たとえ海賊版や個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。
>ですが仮に、ある漫画家が「海賊版サイトで漫画を読みまくって漫画を勉強しました」と発言したら、とうぶん仕事を失うでしょう。違法行為であるかは別として社会的、倫理的に許されない行為であることは明白だからです。
それは学習どうこう以前に、海賊版漫画をダウンロードすること自体が違法やんけ。
まさか未だに映画と音楽だけが違法だと思ってるのか? 2021年に漫画にも拡大されたぞ。
一方でアメリカにはフェアユースがあるので、Danbooruが倫理的に問題があるのか俺には分からん。
Google画像検索も無断転載と思われる画像が大量にヒットするしな。
そしてそこから学習したAIを使うことに問題があるのかはもっと分からん。
文化庁のAIと著作権についてのパブコメの結果が話題ですね。自分も2万件超のコメントの一つです。副業程度の収入を得ているアマチュア絵描きとして、生成AIには何らかの規制が必要であるという立場でコメントを送りました。
主要な問題としてコメントに書いたのが、生成AIの学習に海賊版(違法アップロードコンテンツ)が使われている問題です。
https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/hoseido/r05_07/pdf/94011401_01.pdf
文化庁PDFの30〜32ページに海賊版、つまり違法にアップロードされた書籍、写真、動画、絵などをAI学習に用いることについての意見が並んでいます。文化庁の見解としては、生成AI事業者が海賊版であると知ったうえでコンテンツを学習に用いた場合、事業者は権利侵害の責任を問われる可能性があるとの考え方のようです。
現行の生成AIは海賊版の学習なんてしているのか? 確実にしているようです。画像生成AIのひとつNovelAIが、海外の無断転載の温床であるDanbooruから学習していると公言したりとか、MetaがAI学習に使用したデータセットが膨大な海賊版書籍によるものだったとか、さまざまな話題があります。
もとより、ウェブには権利者に無断でアップされたもの(創作物だけでなく写真なども含む)が溢れかえっていることは周知の事実です。ウェブから効率よく膨大な学習データを求めれば、そうしたコンテンツが混ざってくることは当然なわけです。それを承知のうえで、生成AIの開発は行われている。
これはクリエイターや企業の著作権にとどまる問題ではありません。海外では、画像生成AIの学習データに児童ポルノや個人のプライバシーに関わる画像が含まれていることも指摘されています。自分の知らないところで自分の写った写真がウェブに放流されAIの学習対象になっている、ということもあるのです。
「たとえ海賊版や個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。
ですが仮に、ある漫画家が「海賊版サイトで漫画を読みまくって漫画を勉強しました」と発言したら、とうぶん仕事を失うでしょう。違法行為であるかは別として社会的、倫理的に許されない行為であることは明白だからです。
となれば、生成AIの学習に海賊版を用いることも同様に許されないでしょう(特に、AI肯定の立場から言われる「人間の学習とAIの学習は同じ」という見方ならば)。
クリエイターが、海賊版を学習したAIをそうと知って自身の創作に使うことは、間接的な海賊版の容認とも見なされるかもしれません。
非倫理的な学習方法によって成り立っているのが生成AIの現状です。批判的な立場からクリーンな学習データによるAIが求められるのはこのような理由もあるわけです。
残念なことに、生成AIを肯定・推進する立場の人々はこの学習データ問題に触れたがりません。自分の見てきた範囲ですが、本や記事やSNSで、ここに真摯に向き合っている人はいません。
「ディープフェイクや特定個人の模倣などの悪質なAIの使い方だけが問題だ」という主張をし、その範囲では厳しく批判をする人はいます。もちろん悪質な使い方は許されません。しかし、自身の使っている生成AIがその学習の成り立ちから非倫理的である可能性には触れません。認めると面倒なことになるのがわかっているからでしょう。
反発の声を都合よく切り取り、身勝手に新技術を忌避している反AIというくくりで片付け、本来の問題から目をそらしているのです。
生成AIの開発者も利用者も、まずこうした事実を認めて、横暴なやり方で莫大な学習データを確保し、その問題は無視して利便性のみで強引に生成AIを普及させているという現状に向きあうべきです。
学習データの無作為な広範さが、ディープフェイクなどの悪事を容易にし広めていることも認めないといけない。そこから改めて、あるべき生成AIのあり方を考えないといけません。
許可を得たクリーンな学習データのみを使用し、データの概要は開示すること、これが必要です。
AIの普及が避けられない、技術の進歩は止まらない、と言うのなら、その過程で誰かを踏みつけにしない努力も払うべきです。生成AIを批判する人の大半は、技術の発展に反対しているのではなくその過程の理不尽に反対しているのです。
danbooruタグは最初は膨大だなと思って見るが、何千枚と出力した時点で組み合わせパタンに限界が来る。
なによりポージングが飽きる。毎回少しずつ違うといっても、100枚ほど出力すると、同じポージングだなというのが見えてくる。
Controlnetでポージング変えられるというが、微調整にはいいが、崩れることが多く、モデルにないものは出せない。
プロンプトサイトがあるだろうというが、何ページにも渡ってプロンプトを探しても、似たりよったりで、新しいプロンプトに出会えない。
danbooruでタググループを一通り試したら、それ以上はないか、興味のないタグか、データが少ないかなのだ。
そしてChatGPTでプロンプトを作る道に移るが、danbooruタグで学習されているため、自然言語では出るには出るが、
非クリエイター、画像生成AI(stable diffusion web ui)に触れている(投稿は一切していない)だけの消費者のただのお気持ち投稿です。(反AI寄りです)
また全体的に画像生成AIを批判する内容ですが、画像生成AIを使って画像を投稿している人や記事を書いてる人や金儲けをしている人に突撃するような活動はさすがにダメだと思っています(クマを殺すなと市役所に電凸するようなものと同じと思ってるので)
昨今画像生成AIによる作品が大量に発生してきているためものすごくげんなりしています。DMMやDLsite等を利用している人であれば実感している人が居ると思いますが、これでもかってくらいAIによる生成物が増えてきて明らかに特定の作者まんまの作品がちらほら・・・。また、画像生成AIの進歩が凄いというのを実感する一方でその発信をする人の中に時々pixivのファンイラストの無断使用するとかMMDのモーションをAIでパクっただけ等とAIと関係なく著作権の意識が希薄な人が居てせっかくの技術もこんな使われ方されてかわいそうって思います。
とはいえ、さすがにAIを触る人間の大半がそんな人間ではないだろうとも思ってはいます。賢木イオ氏がアンケートを採った「狙い撃ちLoRAや絵柄模倣、貴方はどう思う?画像生成AIユーザー緊急アンケート」の記事内でも「特定絵師さんの画風再現AI絵」を問題ないと思っているのは1割でアンケートの回答者に関しても世間が「AI絵師」と呼ぶような投稿者は4人に1人以下というものでした。直感的にもそんなものだろうとは思いつつ、画像生成AIの界隈はところどころ不穏な層が結構目立つ。イラストレーターに対して画像を学習したことを直接報告する人とかおそらく犯罪にならないからと反AI層にイキリ散らかすのとか。そんなのがいるもんだからAI推進派の目立つ人(その中でも話が通じる人・まともな人)に粘着したり殺害予告やらと反AIの過激な人も現れていてSNSでは建設的な議論よりもひたすら誹謗中傷ばかり増えて本当に見ていてきついです。
直観的な感覚としては、特定のイラストレーターのデータを学習した上でそのイラストレーターと似たような絵を作成して販売したら著作権の侵害になるのでは?と感じるのだがどうもそうはいかないというのが昨今の流れのようです。
軽く調べただけですが理由として
・著作権の侵害には「類似性」と「依拠性」の“両方“を満たす必要がある
・AI学習そのものは原則として著作権者の許諾なく行うことが可能(権利制限規定として)
といったことがだいたいあげられるのだが
・30条の4には「著作権者の利益を不当に害することとなる場合は、この限りでない。」との但し書きも存在しているため営利的に活動する場合は果たして?
・イラストや同人誌は二次創作の範囲内としてグレーな扱いになるが、グッズの販売はAI関係なく以前から書類送検されている例もあるのでAIだからセーフ論は特に立体物では通じないのでは?
とも思った。
とはいえ中々すっきりしない理由としておそらくは参照すべき背景や歴史や法律の運用等々があるのだろうとも推察されるので素人が口出ししないほうがいいような気もしました。特にAI絵師に「著作権法違反だ!」とかみつくようなものは。トレパク告発もそうですがお前は●●だといった断定するような批判は「真実であろうと冤罪であろうと名誉毀損」になりうるので、問題と思うのなら部外者は違法性が高いと考えうる証拠を保存するだけに留めるのが賢明でしょう。(よく知らない人物に突撃する人がそういった行動をとれるかは微妙ですが)
画像を生成したことでわかったこととして大きかったのが、生成されたまま投稿されたAI生成物(というかただの手抜き)がどんなモデルだったりLoraだったりプロンプトで作られているのか少し予想できるようになりました(私に限らず少しでも画像生成AIに触った人はだいたいできるでしょうが)。そこからまあまあの割合の人は自分と大差ないかそれ以下のレベルに収まっており、私のような人間はあくまでも画像を生成できるサービスを利用している消費者に過ぎないということも実感しました。
また画像投稿サイト「Danbooru」からデータを取り込んでいるとして話題のNovelAIだったりMidjourneyだったりdall-e 3等含めていくつも画像生成AIのサービスが現時点で存在していますが、生成AIを批判している人の中にはこれらの区別がつかない人がまあまあいてなんだかなと思います。複数のサービスに触るとそれぞれのツールが抱える問題と画像生成AI全般における問題を多少は区別して考えられるようにはなるのかなと。
一番大事だと思うこととして「苦手」と言われていた表現のだいたいが数か月したら「可能~かなりいい出来」のクオリティまで引き上げられていることがたくさんあることをリアルタイムで感じることができます。なので画像生成AIが作れない画像がまあまああるというイメージが最初のころはありましたが、今はおそらくほぼ大体の画像を作成できるようになると私は確信しています(画像データの絶対数が少ないものを正確に作る等は苦手なままと予測していますが)。
まず現時点で画像生成AIはパソコンさえあれば元手0円でできるということと、犯罪者としておそらく逮捕されず年間数百万や数千万稼げるというのが完全に嘘ではないというところが厄介と言わざる得ません。好きな漫画家やイラストレーターがいる人間からすると倫理的にどう考えてもダメなのでは・・・・・と感じますが、正直なところ自分も定職に就けず碌な稼ぎを得ることもままならない状況だったらマネタイズに手をだした可能性が非常に高いと思います。
とはいえ、最近のDMMやDLsiteを少しでも眺めている人はわかるでしょうが作成した画像をただ並べた画像集はさすがに売れないようになっているようです。今年の4月ぐらいであれば画像を並べただけでも1000個は販売できたような入れ食い状態でしたが、最近ではその程度では1桁がいいところのようです。とは言うものの11月12月発売の作品でも数千個の売り上げがある作品もまだまだあって、そういう作品はだいたい生成されたものに加筆+セリフ追加+サムネイルを目立たせる といった売れるための努力をしています。作品の絶対数が増え、クオリティの差が目立ってきたことでとりあえず生成AIを使えるだけのレベルに収まっている人は淘汰されていっているということでしょう。されどAIを使って画像を出力するだけで多額の金銭を得ることになれた人が黙って引退するわけもないのでどうにかして利益をひねり出そうと手を変え品を変えガワや看板や提供の仕方を変えて利益を得ようを頑張っているのでどんどん殺伐としてきてますね。本当に。
なにはともあれ「資格」「専門的な知識・教育」「経歴」を必要とせず労力と時間をかけた分だけ金銭が得られる可能性が高い分野はそうそう存在しないため現時点で数百万・数千万の利益を得ているような人からすればAIの規制は死活問題です。どうにかして自分の利益を守ろうとするならAIが著作権違反じゃないと無理のある理由をつけてでも喧伝するのも自然な流れでしょう。
せめて現行法で十分対応できる範囲のものはやってほしいところです。さそりがため先生がトレパク常習犯を刑事訴追した例もありますし、AIだからセーフを信じて過激な行動をしている人に対してはそろそろ何かしらの対応がされてもいいんじゃないかなと期待しています。そもそもAIが登場する以前でも逮捕される様な行動はAI関係なくアウトなはずでは?とは思ってるんですがね。そのうえで非常に大事なことですが、AIを使っているだけの人に殺害予告したりとか犯罪者呼ばわりしたりするのは本当に止めましょう。普通に開示請求通って損害賠償請求までいくので。またAIで俺の絵をパクっただろ系のやつも画像生成した本人が自慢している場合以外はやめましょう。さそりがため先生みたいに明らかにトレパクされているレベルでも刑事訴追まで数年かかってるので立証自体が難しいのと、既に言及してますが真実であっても間違いであっても名誉棄損になりそうなので。
・自分が作成していないものを自分の手書き・撮影したものと偽る
・なんならタイトル以外の文章まるごと自分のものとして投稿する(テラーノベルが無断転載の温床になってましたね)
・本来モザイクがかかっている画像のモザイクを外した画像をだす
といったことをしていた人はAI以前から存在していた。AIは単に自力ではこういったことができないからやらなかった人が行動を起こすための敷居を大きく下げたに過ぎないのではと私は考えています。世の中にはまあまあの数の人が労力と利益に対して罰則や失うものが多いために犯罪や犯罪じゃないが良くないことを実行していないだけで、今回のAIによって労力が限りなく0に下がり一方で得られる利益(金銭だったりネットで話題になる、注目される)が上がってしまった。加えて逮捕されるリスクも低い(そう言われているだけで実際にそうかは別)と言われたら犯罪者未満~一般人程度に含まれる人がこぞって暴れ始めたのだろう。文化庁含め画像生成AIにおける著作権の問題が各地で巻き起こっているけども、「簡単にできるが逮捕されない」ということを信じて行動する人がたくさんいることをどうにかしないと何も変わらないと思います。今はまだそれなりのパソコンを使っての作成や有料
サービスを利用しての画像生成が主流ですが、スマホでの作成が主流になれば今よりも酷いものになるでしょう。
そのためにも犯罪行為をしたらちゃんと逮捕されるという当たり前の事実を徹底的に広め・認識させるしかないでしょう。
「いくらか還元せよ」は主題としている部分からズレてはいるが、理解としてはおおむね合ってそう
別の言及にもこれから返信するつもりだけども、ここまで書いてて、よく考えたらOpenAIが「権利侵害の賠償金肩代わりするで」って言ったらIT大手が「何言ってんだライセンス料払ってたらやってらんないわ」って言い放った話が出た段階で、この"生成AIは権利侵害をしているかどうか"の議論はとっくに終わってるはずなんだよな。NovelAIも違法転載だらけでおなじみdanbooruからデータ引っ張ってるって宣言してるし…
東北ずんだの榊正宗が長文お気持ちで「無名に著作権なんかねえよ(意訳)」発言をぶっ放したり、あちこちの論争でもそうだが、権利侵害ではありません!のラインにわざわざ戻ってバトルしてるのが変なんだよな
AI学習否定派の神絵師様の証言が集まっていたので、ちゃんとAI学習対策してるのか調べてみた。
https://www.itmedia.co.jp/news/articles/2305/08/news068.html
名前(敬称略) | フォロワー数 | Pixiv | danbooru | |
あかもく | 24万 | 非公開 | 公開中 | takedown済 |
イコモチ | 64万 | 非公開 | 公開中 | takedown済 |
皐月恵 | 13万 | 非公開 | 公開中 | 転載済(58件) |
黒須 | 10万 | 非公開 | 公開中 | 転載済(218件) |
霧月 | 25万 | 一部非公開 | 公開中 | 転載済(189件) |
転載サイトまで対策しているのは5人中たったの2人しかいなかった。
件数を記載しているように、転載サイトには作者タグがあるのでほんの数分で神絵師が投稿して転載された作品数まで知ることができる。
そしてイラストのメタデータはやたら充実している(anond:20230507074525)ので転載サイトで学習してしまえば悪意のある絵柄模倣はpixivだけ非公開にしようがハナクソほじるように簡単に実行できるだろう。
そもそもTwitterでもイラストを大公開しているので、アカウントと関連付けて学習するだけでもPixiv公開と似たようなAI学習効果はあるだろう。今すぐTwitterのイラストを消すべきでは?
流言に流されてなんとなくの対策をしてる人が多く、半端で非常に残念としかいいようがない。
転載の対策をしない限りTwitterにイラストアップしてる時点でPixivを非公開にしようが関係なく転載され続ける。Twitterだけでも学習できるけど。
ちなみに転載は海外サイトで行われてるので最強の盾「フェアユース」が壁になってるから開き直られたら対策不能。danbooruはクリエイターの依頼で非公開対応してくれるので比較的優しいサイトではある。
今のフォロワー数で十分に仕事が来て、絵柄の模倣が損になる神絵師はこういった非公開対応をする価値があるが、
アンチAIの人はAI使ったことないからよく分かってないみたいだけど、
Pixiv自体はAIにとって話にならないんだよね。学習の参考にならないから。
Pixivの次にヤバいのがTwitterなんだけど、まさかアンチAIなのにTwitterにイラストアップしてるマヌケだったりしないよな?
https://b.hatena.ne.jp/entry/s/twitter.com/tadanojako/status/1654676274089197568
AIが学習する上で一番重要なのはメタデータの質なので、最近の2次元AIは黙って転載サイトdanbooruとか使ってるよ?
danbooruの転載元として多いのはPixivとTwitterなのでPixiv云々は致命的に間違ってるわけでもないのだが。
本気でアンチAIならTwitterに一切のイラストを投稿しないで活動しないといけないので、
人々に見て貰いフォロワーを増やすことで仕事に繋げるイラストレーターとしては自殺でしか無いと思うけど、思想信条の問題なら仕方ないかな。
転載サイトのトップで見かけたピーチ姫だが、投稿されたPixivと転載先のdanbooruのメタデータの差は圧倒的でどちらから学習したほうが精度が高くなりそうかはバカでも理解しやすいだろう。
#mario (series)
#super mario odyssey
#princess peach
#1girl
#blonde hair
#breasts
#day
#earrings
#from above
#hat
#high heels
#large breasts
#lips
#long hair
#long skirt
#looking at viewer
#open mouth
#outdoors
#pink lips
#pink skirt
#shirt
#solo
#white headwear
#white shirt
pixivに転載サイトなんとかしてくれという要望なら理解できるのだが、Pixivを悪者にしたら回避できると頭の悪い学習をしてしまっているようだ。
Pixivは規約上スクレイピング禁止でも転載され放題な現状なので。
よくわからない第三のイラスト投稿サイト()とやらがスクレイピング禁止してもイラストが集まるなら転載サイトは無視してくるよ。