はてなキーワード: テキストとは
プロパーだと『清掃業務担当なのに掃除をしないことが許されている』みたいなことは起きるが、別に歓迎されないぞ
明らかに発達障害だったり、障害に該当しないが極端に生きる力が弱い、しかしお勉強だなら出来るぞい・やる気があるぞいが、
あらゆる採用試験に落ちるという特殊スキル持ちでなければ、意外と大企業はトンデモないのがいるから生き残れるかもしれんしな
トンデモないの一例
だから連想ゲームで出てきた過去の長文を貼り付けてるってことか
AIがセッション内のテキストパターンを繰り返す様を見てる感じがするわ
新しい入力がなければ同じことをぐるぐるぐるぐる
嘘じゃなくて、幻覚だったな
数日前に書いてたテキストファイル捨てるの勿体無いと思ったので張る
例のあのフォーマットに乗ってWeb漫画の話をしようかと思ったがWeb漫画は山ほどあるし別に網羅的に読んでる訳でも無いので単に自分の好きな作品を書くことにした人が居たので便乗。
消えてる作品以外はブックマークが残ってるので探しやすくてよかった。
2012か13ぐらいから読み始めた人。それ以前も知らないし、最近も知らないしひどく偏ってるはず。順不同
みんな大好き(なはず)。転生元の(中途半端な)知識と超絶魔力持ちでチートではあるが、虚弱常識知らずなど、情熱と人脈でカバーしてく。
これと謙虚ぐらいしか男性向けっぽいの読んでなかったし、読んでも合わないの多い中(ゴミ拾いのとかテイマーのとかは読んでた)、何度も読み返した名作中の名作。
言い過ぎだけど、パトレイバーや銀英伝レベルで社会に出てから有用な知識が得られる。
(パト、銀英伝信者からしたら言い過ぎ、そうではない人からしたらそんなもんかってなる?)
現実世界への巻き戻り。細かいこと(と重要なことのほとんど)は忘れたが、サッカー選手になれなかった大人がサッカー始めた日に戻ってやり直す話。
確か戻るのはその一回ぐらい。戦術等の知識が大人レベルなのと、コツコツ努力できる(練習の目的がはっきり、効率もよい)のと、あとなんか鷹の目みたいな俯瞰視点だけで頑張る。
雰囲気は週刊少年誌のサッカー漫画みたいなの(ジャンプっぽさはなく、サンデーマガジンのどっちか寄り)。恋愛要素が少なくて物足りなかったような、中学生編ぐらいまでで終わったのとかで悲しかったような。
これと続編(サブアカウント)のセット。アイリッシュスナイパーは含まない(好きだけど)
VRMMOは二大ジャンルのひとつだったり、転生、転移に次ぐ第3のジャンルだったりしたが、あまり人気作が無かった(当時の個人的な印象)中、(根底に)デスゲーム要素もなく、描き切りつつ、VRMMO系で不足しがちな現実世界にも重点を置いたのが本作。
MMO要素は各キャラのなりきりに由来するコメディ要素やストーリーの本筋に絡む仕掛けであって、中身は群像劇要素も強く、主人公以外の成長物語でもあり、半沢みたいなのとかでもあり、ミックスグリルみたいな作品。あえて大げさに言うと、大長編ドラえもん詰め合わせみたいな。
章ごとに目標が変わってたりしつつ、最後でどかんと一気に色々纏まるのがめちゃくちゃ気持ちよかった。主人公大人だし、なろうっぽくない(なろうっぽくないことはないが)
主人公も一応精神的に色々成長します。地の文の好き嫌いは分かれそう。
クソゲーとして名高いバグだらけのゲームの中に入ってしまい、バグ(仕様()も多い)を駆使して気持ち悪いことを沢山する。
読んで知って欲しいのだが、全方向を騙していくのとか、サブキャラとかが立ってるのとか、一応色々吹っ切れてるのが面白すぎた(作者的にはセーブしてるのかも)
本作作者の他作品も少し系統違ってても面白いので、他作品挙げたいが完結してなかったりするので、出会いの本作をエントリー。
タイトルそのまま。ちんちくりん系の女子と普通の女子のコンビに、個性的なパーティメンバーなどで冒険する。
基本的にはテンポよく成長していくし、仲間も頼りになる。地の文とかほのぼのした雰囲気も好きだし、ちょっと年齢層高め向けのギャグとかも合ってた。作中でどういう扱いだったかは忘れたが馬は脳内でひんべえ(いつもいっしょのおうま)になる。
真剣なシーンでも気が抜けるような描写が多くて好きだったかも。
終盤SF過ぎたのとか好みが別れるところか。SF方面だったかは定かではないが
時代がずれてたら防振り(途中までしか読んでない)ぐらい売れてたかも。コミカライズされてたの今知った
頭おかしなった。突っ走ればよかったのにと思ったような。
おもろい。
これも流行った。
きつね可愛い。同作者の他作(沢山あったはず)も読んでみたけど、これがなんか時期的になのか、一番ハマった。
その他の候補作
影響は受けたが、読んでないので
色物かと思ったら意外としっかり面白かった。アニメ見て、原作一気読みした。
転スラ
すごいのはみんなわかってるが、重要度は低い。
このすば
どこにも書いてないが、これ系では他作品のほうが影響受けたので除外。
宝くじで40億
Immersive Translateっていう翻訳ツールというかブラウザ拡張機能が便利すぎてヤバい
先日、恋人が浮気相手とデートしている現場にバッティングしてしまった。
目が合った時に気まずそうな顔をしており、テキスト連絡で謝罪と話し合いをすることになった。
正直、恋愛の負荷100%受け持たなくてよく都合がいいので、好きに楽しんでもらえればいいのだが、今後のことを考えると怒るふりをして交渉材料にしておきたいのだが、如何せん気持ちがノラない。
怒るふりをするのも、話し合いをするのも気持ちがノラないことに時間を使うのは面倒くさいのだ。
自分の体感、男も女も7割くらいは複数の関係を持ち、足りない事は別の人間で補っている。
ひとりの人間にすべての要望を求めるのは不可能だ。運良く相性がバッチリのパートナーと出会えれば幸運だが、そんな幸運はなかなか無い。
人は時間とともに変わっていく。ライフスタイルによって関係性も変わっていくが、切れない縁になってしまうと離れることも難しい。
皆、建前と本音を使い分けてそれなりにやっている気もするのだが、いつまでこんなプレイを続けていくんだろうな。
あー、面倒くさい。
ひとの増田を『みんなおまんこ』みたいな紹介するんじゃねぇよ😠
𓂺という文字は、古代エジプトの表記法に由来する象形文字です。具体的には、この象形文字は座っている人物を表し、人間や神をさまざまな姿勢や役割で表現することが多い一連の記号の一部です。
主な詳細:
一般的には、膝の上に手を置いて座っている人物が描かれています。
テキストに応じて、人間の姿、特定の個人、または座っている存在に関連する抽象的な概念(安定性や存在など)を象徴する場合があります。
古代エジプトの象形文字では、このような数字は決定詞(単語の意味を明確にする記号)または表意文字(考えを直接表す)として機能します。
単語の中での使用法によっては音韻的な意味を持つこともあります。
このような座像は、畏敬の念、安定、落ち着きなどと結び付けられることが多く、エジプト美術における人間や神々の描写を反映しています。
これらは、特に形式的または敬意を持って人間を罵倒するときに、人の名前、タイトル、または役割の説明に使用されることがあります。
この象形文字をどこで見たか(例えば、芸術作品、テキスト、象徴的なテキストなど)についての詳しい情報があれば、その解釈についてより正確な情報を提供できます。
現実世界の問題で「真実はこれだ!」って綺麗に纏まることなんてほぼ無くて、どのポイントで合意ができたか、の問題でしかない。
見る人が違えばその分切り口も違うし、歴史的な大事件であれば起きた後だって何十年何百年と検証が続いていく。
陰謀論者はそういう自分なりの切り口を頑として譲らないとか、検証自体への批判が無いのに自分の正しさを信じて疑わないから陰謀論者なんじゃないかな。
だいたい応援してる相手が不正していたところで自分が不正したわけでもないのに、自分の意見を立場化する人が多すぎるし、「陰謀論が陰謀論であることを証明する」という発想自体、テキスト主体のネットに汚染された思考だよ。なぜなら陰謀論とは上記の通りで個々人の振る舞いの問題なんだから。
トランプ再選は2回目で新鮮味が薄れたためかそれほど発狂していなかったけれど、兵庫県知事選挙ではいつものはてサ仕草の愚民論で喚き散らしているね。立花が参戦して大きな役割を果たしたのもはてなー発狂の一助になった笑
はてなって一応ネット界だけど感性が完全にオールドメディアなのが面白い。テキスト系サイトの系譜でジジババの巣窟だからなぁ。テレビもはてなも将来的には今のラジオみたいな見向きもされない立場になりそう。トランプ再選の力になったポッドキャストは、日本ではYoutubeのリハックスが担当しているし。
そら他人のこと書いてる風で自分自身のこと書いてる創作だからな。反対だろ
というか、資本家の方が強いのだから元増田に限らず反対でいいよ
しかし、冗談みたいに思うかもだが、ブクマカやブクマカを兼ねている増田は、職場で泣くのは当たり前とか無断欠勤とかやってるからな
そういうのが職場にて良いとされている日本社会みたいなので、元増田みたいのがいてもいいんじゃないですか、べつに
闇深ブクマカ:職場で泣くのは当たり前!配慮しろ!子育て中の人のサポートをしない人は辞めて自営業しろ!媚びて早く結婚するのは無能の戦略!私は発達障害だからー
▼関連増田:話し合いの途中で泣いちゃう人への対処、どうすればいいの?
https://anond.hatelabo.jp/20230426081719#
https://b.hatena.ne.jp/entry/s/anond.hatelabo.jp/20230426081719
あと再放送
声を荒げるのと同じく、泣くだけでハラスメントという常識をインストールしてもろて
フツーの人はどういう時に自分が泣くかは自覚的になって防ごうとするんだわ
防げないなら対面は避けてテキストに切り替えるんだわ
つか『俺の時代は拳だって飛んできた』みたいな昭和の体育会系化石マウンターや頑固ラーメン屋オヤジ自営業者ならともかく、
繊細な生きづいちゃん・くんなのに『仕事で感情を見せるのを是』としているブクマカとブクマカを兼ねている増田が多すぎてビビり散らかしてますわ
コミュニティノート:AIが生成するテキストが等間隔の段落形式になることがありますが、これはAIの特徴ではありません。段落の形式は、AIのモデルが学習したデータや設定に依存します。また、異なるAIモデルやプラットフォームにより、出力されるテキストの段落形式は異なる場合があります。ユーザーが指定したフォーマットや文書作成ツールの設定も影響を与えることがあります。
役に立ちましたか?
んんwwww 増田氏、何やらX社のGrokやら画像生成AIの背景について詳しく語っておられるようですが、ちょっと待っていただきたいですぞwwww 拙者の見解を述べさせていただきますぞwwww
確かにGrokはテキストに特化した検索支援AIとして開発されているようで、その点については同意しますぞ。しかしながら、画像生成AIの領域については、Black Forest Labs社のFLUX.1を利用しているとはいえ、X社が完全に無関心であるとは言えませぬなww
また、増田氏が述べられているLAIONデータセットの件ですが、「著作権的にクリーンな」画像生成を目指す中で、技術的課題が存在することは確かです。しかしながら、LAIONがドイツの法律に基づき公開データで運用されていることや、ドイツ国内での勝訴もあり、運営は法にのっとっているという点も否定できないですぞwwww
GlazeやNightshadeに関しては、反AI運動の手段として注目されていますが、それがどれだけ実効的かについては議論があるようですなwwww しかし、その毒入れ(poisoning)の考え方が如何に強力であるかという点は、拙者も評価せざるを得ませんぞwww
増田氏、拙者の見解をお役立ていただき、いかなる分野においても多面的な視点での理解を目指して頂ければ幸甚ですぞwww あまり肝に銘じずともお気を悪くなさらず、拙者の考えを一つの参考としてご覧くださいですぞwww
そもそもの話、X社は画像生成AIなど作っていない。彼らがつくっているのは検索支援AI Grok。学習に使いたいのはテキストの方であって画像ではない。
わかりやすさのために ChatGPTと比較してみる。2023年にリリースされた GPT-4 に試しに今期のアニメについて質問してみよう。
今期最も人気のアニメはなんですか?
ChatGPT:
2024年の今期で人気のアニメはいくつかありますが、「進撃の巨人」や「呪術廻戦」が特に注目を集めています。また、新作では「東京リベンジャーズ」や「スパイファミリー」も話題です。どの作品に興味がありますか?
アニメに詳しい人ならちょっと古い話をしているのがわかるだろう。 GPT-4 が学習を行なったのは2023年までの情報だ。なので最新の話題に対応できないのである。
一方、Grok は Xの投稿をリアルタイムに検索して反映する。もし Grok で同じ質問をすればダンダダンやリゼロ、ブリーチ辺りの話をするはずだ。つまり、Xが収集したいのは「ダンダダンの7話泣かされたわ・・・」みたいな投稿のことであってイラストではない。
Grokには画像生成機能がついているが、これは自前の物ではなく Black Forest Labs社 の FLUX.1 というモデルである。X社が Xに投稿されたイラストを収集して学習させているわけではないのだ。それでは FLUX.1 の訓練に使ったのはどこの画像なのだろうか?データセットは明らかにされていないが十中八九使っていそうなのが LAION-5B である
現在大手の企業は「著作権的にクリーンな」画像生成AIをつくっているが実際には版権物が出てくることが知られている。なぜそんなことが起こるのだろうか?
このからくりは LAION のデータセットにある。LAIONはドイツにある非営利組織。ネット上のありとあらゆる画像を収集しタグをつけたデータセットを公開している。
A. LAIONは非営利の研究組織です。ドイツの著作権法(§60d UrhG)に従いあらゆる著作物の利用が許されています。
とあるようにドイツの法律上合法である。実際に訴えられた後LAION側が勝訴している。とはいえこの組織にはAI関連企業からの多額の寄付金があることが知られており、パチンコ3店方式のような意味合いでの合法とも言える。
尚、反AIさんと反々AIさんが著作権法第30条の4を巡って喧嘩をしていますが、世界では日本の法律は関係ないです。いちおう念の為。
他の絵師さんに Glaze を使うように詰め寄ったり、使わないやつはAIに加担していると攻撃したり。挙げ句の果てには「自分の絵にGrazeをかけました」と宣言したり。
もう、全てが間違っている
そもそも、Glaze も Nightshade もAI学習を阻害するものではない。学習したモデルをぶっ壊す毒なのである(poisoned って書いてあるでしょう?!)
相手に食わせなければ意味がないんだ。Glazeかけたとか自分で言うな。対策されるでしょう?(後述)
それと他の人に強要する意味はない。使いたい人が使えば十分なんだ。
事実すでに効果は上がっていてOpenAIは悲鳴をあげ対策を急いでいる。
反AIさんの考えるよりも Glaze/Nightshade はずっと強力だ。それはデータセットを汚染する攻撃である。簡単に言えば Nightshadeは「学習中に他の絵に変換されてしまう」ノイズをかける。この操作を毒入り(poisoned)と呼ぶ。ピクセル毎の微小な変更なので Nightshade をかけた後もイラストはぱっと見はかわらない。
Nightshadeを使って例えば 犬の画像を猫の画像になるノイズをかけたとする。するとAIは犬と猫が混ざったまま学習を進め「犬」と言う概念が無茶苦茶になってしまう。
図:毒入りモデルの変化 (arXiv:2310.13828から引用)
上の図は毒入りの画像を200枚食わせたときの変化の様子だ。犬が猫になってしまっている。それだけではなく”犬”に近い概念、”子犬”、”ハスキー”、”狼”もぐちゃぐちゃになっている。
図:毒入り枚数による変化 (同引用)
こちらは50、100、300、と毒入り枚数を変化させたときの様子。50枚の時点ですでにめちゃくちゃになっている。
もし私が反AIだったなら、イラストに Nightshadeをかけて danbooru に投稿するだろう。二次元イラスト特化の画像生成AIはdanbooru2021/ danbooru2022 などのデータセットを使っているものと見られる。これらはイラスト投稿サイトdanbooru から収集したものである。
ところで Glaze も Nightshade もその内部で画像生成AIを使っているということを知ったら反AIさんはどんな顔をするだろう?
Glaze は特徴量抽出を行う。おそらく Stable Diffusion の VAE(Variational Autoencoder)を使っている。そしてNightshade の方も 内部ではStable Diffusion 等の画像生成モデルを用いて別の画像を生成する。
Glaze が機能しない?あるいは解毒方法が見つかったかもしれない
上のスレッドのコメント欄では Glaze が論文のようには機能しないことについて議論され「画像のリサイズをしたのではないか」と予想している。Glazeをかけた後に画像を縮小、データが圧縮されてノイズ効果が消えたのではないかということだ。
A) 絵師さんが Glaze をかけたあと画像を縮小した可能性
B) 画像サイズやファイルタイプによってはプラットフォーム側が勝手に加工をする
C) 学習の際にリサイズを行う (Stable Difusion XL では1024px, 古いモデルは512px)
A,B については絵師さん側に知識があれば対処可能だけれども C の方はなんともし難い。小さい画像を投稿したところで [縮小→拡大] でノイズは落とせそうだ(解像度は悪くなるだろうが)
LAIONは収集画像そのものを所有せず、データセットはウェブ上にある画像のurlとタグをまとめた物であるらしい。
ということは、LAIONの新しいデータセットが公開されたタイミングで画像のurlを変更すれば学習に使われることを回避できそうだ。特に、個人サイト/ブログの所有者ならば古い url に●んこ画像でも差し替えておけば嫌がらせになる。(タグ差し替えはこのグラフの Simple Attak に相当)
90年代においては画像に直リンクされたときの報復としてうん●画像に差し替えたものです。まさか令和になっても有効とはね
この記事をぼちぼち書いているいるうちに2日が経過した。今、私のXのタイムラインもおすすめもとても静かだ。攻撃的な人たちやデマに流されやすい人達は皆どこかに行ってしまったようだ。残ったのはこれまで静かにイラストを描き続けてきた人たちでとても穏やかな空気が流れている。ずっとこのままがいい。
最近はテキストが死んでて動画の方が最新情報にアクセス出来るからかな。
マジでGoogleがゴミ。1年も前の情報が先週更新でGoogleの1番上に来てたりする。
俺は知識があった話題だから、この記事1年前じゃんってわかったけど(ポイ活関連ね
かんざきひろ先生は画像生成AIに対して批判的であるのだが(それについては全く問題ないと思ってる)、ChatGPTについては容認派のようである。
ぼくがクソリプと認定した人は無言でブロックします
反省した方はchatGPTで滅茶苦茶面白い謝罪文を生成し送付してくれたら解除しません— かんざきひろ (@kanzakihiro) January 7, 2024
さて、イラストレーターがChatGPT等の対話AIに対して寛容であるのはなぜだろうかって、10分ほど考えたわけだが
4つほど候補が思いついた(諸説ある)
1.ChatGPTは生成AIではないと考えている
2.ChatGPTは生成AIではあるが、創作がメインではないので大丈夫
3.ChatGPTは生成AIであるが、テキストは画像よりも著作権の保護の重要度が低いので大丈夫
こんな感じだと思ってるのだが、どうだろうか
これは先日からワーワーなってるAI問題とは関係ないやつです。
絵を描けない自分から見たAI絵師(笑)の無様さを書き留めてるだけで、読めたもんじゃないです。
AI絵師とは、バズるイラストを描ける絵師の活動を、指を咥えて嫉妬している人間のことだ。
絵師がバズる絵を描くまでに、何年何十年と努力し、練習し、勉強していたことから目を背けて、その努力の結晶をAIに学習(と言う名の無断転載、無断複製)させてどうにか自分の手柄にしてバズりたい。それを目的としている。
絵師はずるい、そんなに絵が上手くて、バズって、称賛されて、自分のようなAIでテキストを打ち込んでキメラ画像を生み出すしか出来ない人間と雲泥の差がある。ずるいずるいずるい。
反して絵師という生き物は、実は自分が特別だという認識が低いらしい。
「自分は年々可視化され増え続ける絵を描く人間の中の一人」でしかなく、その中で藻掻いて、オリジナリティを追求し、自分の理想を追い求め続けていると言われた。
私にはちょっと信じがたくて、若干「そうは言いつつ絵描けることに優越感ちょっとはあるっしょ?」と思ったりもした。というかそれぐらい思ってても全然良い。
AI絵師はそんなことを考えたことすらない。勝手に「絵師は自分たちが特別だと思って傲慢でAI絵師たちを見下している」という妄想に取り憑かれ、逆恨みをしている。だから「絵柄の私物化」なんて発想が出てくる。
そもそもあのイラストレーターさんとあのイラストレーターさんって絵柄近いよね、なんてケースはいくらでもあるのに、絵師が長年積み上げてきた絵柄を「私物化」しているなんて発想がどこから出てくるのかわからない。
絵柄が欲しいなら自分で作っていけば良いだけだ。
このイラスト・漫画飽和時代で、全員がなんの影響も受けることなく絵柄を生み出してるわけがない。そんなことにも気付けない。
AI絵師は、自分たちが受けるべきであった称賛、利益を「絵師たちに盗まれている」と思い込んでいる。絵師たちは自分たちAI絵師を差し置いて私腹を肥やし、自分たちの取り分をうばっている。らしい。なんのこっちゃ。
だからAIに絵師たちの絵を学習させて盗んでも良いと思っているのかもしれない。
AIでイラストを生成する行為をきちんと「実は駄目なこと」だと認識できていればの話だが。(中には相当数のガチのキチ◯イもいると思う。)
AI絵師は「バズるってほどじゃないけど一定数フォロワーやファンがいる絵師」のことが目に入ってない。
AI絵師になれば何故か一足飛びで「バズれる」と思い込んでいる。
黙々と今日から棒人間を描くことから始めて、練習して、同好の士とちょっとずつ仲良くなり、数いいねから始めるとかそういう発想がない。いきなり神絵師になってバズりたい。
AIイラストが一般的になるとしても、「AI絵師」はただの「AIにテキストを打ち込んでる無能」にしかなれないことがわかっていない。
可能性があるとすれば「ドラゴンカーセックス」みたいな、それとそれ合わせる?みたいなセンスくらいなら賞賛されるかもしれないが、生成されたイラストについてAI絵師が賞賛されることはない。
これらについて社会的に利用がどうのこうのとか屁理屈抜かしてるが、現時点でAI画像そのものが話題になることはあれど、生成したAI絵師個人については認識されていないか、悪評しか聞こえてこない。それが答えだ。
反反AIで特に絵に対して文句をいっている人って、絵描きに対してコンプレックスがあるか、AIで絵を描いて儲けたいとか何かのポジショントークとしか思えないところがある。
例えば DeepL とかの AI ベースの製品も入力内容を学習に使わないオプトアウトができるようになっている。
X とか SNS に載せたらそれは学習に使いますと言われたらそのSNSを使わないという選択があってもよい。
そこを学習は合法だからと連呼するのは、会社のデータをなんでもかんでも外部のサイトに提供してお漏らしすることが許されている会社なのかな?AI の発展のためにおまえのデータをすべて開示すべきとかいってる奴は働いたことがないか、やっかみか何かか?と思ってしまう。
クロール防止を避けられてしまうならウォーターマークなどで自衛するしかないだろう。これは生成AI以前でも行われていたこと。難易度を少しでもあげLORAされにくくする、学習に時間がかかったり手間がかかるので悪用する利益に見合わないと思わせるようにするというのは問題ない。
現代の暗号化も素数とか計算に時間がかかることに依拠しているものもあるように、現実的な時間というのは重要なファクターなのだ。
これは絵だけでない。声やテキスト全ての学習されたくない情報をどうやって学習させないかをちゃんと考えて一般の人に広めるのは個人情報保護のように今後リテラシーになっていくのかもしれない。なので学習されないようにしていると冷笑するのではなく、安全な公開方法を用意したりする仕組みを考えるべきなのだろう。
あの法律、生成AIをあまり想定してなかった、かつ一度決めたら引っ込められないお役所仕草が相まってると思うのだよね。
AI にも色々あって画像認識、背景削除など色々使える。GenAIと違いこれらのAIは基本的に学習した結果がそのまま出力されない。このように使われるなら納得されるだろう。
一方GenAIは学習結果から同じフォーマットの成果物を出してしまうのが問題。画像生成は学習したデータを元にした画像しか生成しない。LLMもニュースや過去のデータを元に回答している。それらには本来権利があるのに無視してしまっている。
声優の話や、海外の getty やニュースサイトの訴訟とか、今後法律も変わってくると思う。
EU なんかは学習元データ開示させようとしてるし、アメリカのエンタメ界隈のロビー活動によってはディズニー法みたいに変わることもあるだろう。
特許や著作権同様、国際協調して進めるべき案件だろう。盗まれるならやはり保護技術や法律が必要ということ。
学習速度と生成速度が全然違う。前述のとおり暗に現実的な時間というものが守ってくれていた部分がとっぱわれてしまった。
活版印刷の時に著作権ができたように何らかの制限ができてしかるべきだと思う。
横道にそれるが量子コンピューティングなりで暗号鍵やHashが推測できるようになったら暗号化はどうなるのだろうね。パスワードの解析も人間が考えたものだから解析するのは問題ないとか言うのだろうか。すでに不正アクセス防止法があるが。
そこは同意だがライセンス、特許はあるよね。ライセンス違反をしてコピーをしたら訴えられる。プロプライエタリな製品のEULAだと大体リバースエンジニアリングも禁止だ。
プロプライエタリの製品のソースコードをすべてオープンソースにせよとかおもってるのかな?
音楽は消費するのに少なくとも一曲3分以上かかるし、小説、動画だってもっとかかる。
一方、絵というのは一目で個人的な見解のレベルでは良し悪しがわかる。そのため消費するのに時間がかからない。それなのに人間が作成するには時間がかかるという非対称性がある。
そういうものをAIで数秒に一枚生成されてしまうのだから反発が大きい。
声もそう、その人の声でなにかするというのは一瞬で消費される。一度学習されてしまえば再利用に歯止めが利かない。
消費するために公開せざるを得ないものについても保護できるようにすると言うのは必要。それが著作権以外でもいい。
何でも学習合法にするとDeepFakeや類似作品が溢れかえる。しかも生成は数秒。
それをすべて被害者が訴えて回るのはフェアではない。学習、生成段階で歯止めをかける仕組み、法制度が必要になってくるだろう。
それを合法だから!反AIは異常とか言ってるのはそれはそれで思慮が足りない。
一方、合意して学習した内容を使ったAI、例えば自分の作品を自分で改善するといった分野に使うなら否やはないだろう。
画像を生成するAIによる無断学習や利用を防ぐために、以下のような対抗手段を講じることが可能です。
1.透かし(ウォーターマーク)の埋め込み:
画像に目に見えるまたは見えない透かしを入れることで、無断利用や生成AIの学習に対して抑止効果を期待できます。特に、目に見えない形で画像データに暗号的な透かしを埋め込む「デジタル透かし」技術が有効です。
画像データに著作権情報や「AIによる無断学習を禁止する」といったメタデータを埋め込み、ウェブサイトには robots.txt ファイルで画像クローラーのアクセスをブロックする設定を追加します。これにより、クローリングや収集の抑制が期待できます。
ステガノグラフィを用いて、画像に気づかれにくい形で識別情報を隠すこともできます。これにより、画像の流出経路や利用先を追跡でき、無断利用の発見に役立てることができます。
4.法的な警告表示や利用ポリシーの明示:
ウェブサイトや画像の配布先に、AIによる無断利用や学習を禁止する旨の法的警告や利用ポリシーを明示することも有効です。利用条件をはっきりと示すことで、AI企業や研究者が慎重になる可能性が高まります。
AIが利用しにくいように、画像に人間には気づきにくいパターンやノイズを挿入する技術もあります。たとえば、AIにはノイズとして認識されるが、人間には問題なく見える小さな変形やカラーパターンを追加することで、AIによるデータ学習が困難になる場合があります。
生成AIの学習を混乱させるための手段には、以下のような方法が考えられます。
1.ノイズや歪みの追加:
画像に目立たない程度のノイズや歪みを加えることで、アノテーションモデルが境界や特徴を正確に認識しにくくする手法です。たとえば、ピクセルレベルでランダムなノイズを追加する、わずかに画像をぼかす、あるいは境界線付近に小さな変化を加えるといった手法が有効です。
アノテーション処理は、対象物の輪郭や特徴を正確に捉えることが重要です。そのため、背景や対象物の輪郭にわずかな不規則性を加えることで、アノテーションツールが対象物の境界を正確に判断しにくくすることができます。たとえば、背景に模様や偽の輪郭を挿入する方法です。
画像に人間には視認しづらい形でテキストやラベルを埋め込むと、AIのアノテーションプロセスが混乱する場合があります。これにより、AIが意図しない領域を注視することがあり、誤認識を誘発します。
4.色や明るさのランダム変化:
画像の色や明るさを部分的に変化させ、一定のパターンを持たないようにすることもアノテーション処理の混乱を招く一手です。これは、オブジェクトの検出や認識が色や明暗の差異に依存している場合に有効です。
5.擬似的なオブジェクトの追加:
画像内に小さな擬似的なオブジェクトや模様を追加することで、AIがそれらを誤って主要なオブジェクトと認識し、アノテーション精度が低下する可能性があります。特に、背景に似たオブジェクトを散りばめることで、AIはどの部分が対象なのか判断しにくくなります。
AIの認識を誤らせるために用いられる「アドバーサリアル(敵対的)な例」を使う方法もあります。特定のピクセルパターンや色の配列を配置することで、AIのアノテーションが意図的に誤作動するよう誘導できます。この技術は深層学習モデルに対して特に効果があります。
画像全体にわずかなカモフラージュパターンを重ねることで、AIの認識を混乱させる方法です。この手法では、人間が見た場合には問題なく認識できるものの、AIが対象を捉える際に誤って検出するようなパターンを画像に追加します。
・思考実験として、danbooruなどアノテーションの元データとして使われているサイトのタグが荒られたら画像生成AIのモデル作成にダメージはありますか?
思考実験として、Danbooruといったアノテーション元データのタグが荒らされた場合、画像生成AIのモデル作成に与える影響は以下の通りです。
Danbooruは、イラストや画像に対して詳細なタグが付与されており、これらのタグ情報は画像生成AIの学習にとって非常に重要です。タグが荒らされることで、画像とタグの対応関係が崩れ、モデルが正確な特徴を捉えにくくなるため、生成精度が低下します。
例えば、特定のキャラクターやテーマに関連するタグが荒らされ、誤った内容のタグが付与されると、モデルはその誤った情報を学習し、キャラクターの特徴や設定が再現されにくくなる可能性があります。
タグが荒らされると、モデルの訓練にノイズデータが増えるため、学習効率が悪化します。たとえば、「黒髪」のタグが誤って「金髪」などに変更された場合、モデルは同じ画像に対して異なる特徴を学習することになり、結果として生成画像の一貫性が失われることが考えられます。
また、同じ画像に異なるタグが付与されることで、モデルが過学習や誤学習を引き起こし、生成された画像が本来の意図からかけ離れたものになる可能性もあります。
Danbooruでは、特定のキャラクターやアートスタイルを識別するタグが多く存在します。これらが荒らされると、特定のキャラクターやスタイルのデータが混乱し、モデルが正確にキャラクターの特徴を把握できなくなるため、ユーザーが期待する生成結果が得られにくくなります。
例えば、あるキャラクターのタグが「髪型」「服装」「色彩」などで荒らされると、そのキャラクターの再現が曖昧になり、モデルが正しいビジュアルを生成できなくなることがあります。
タグが荒らされると、データセット全体の信頼性が低下します。信頼性の低いデータをもとに学習したモデルは、特定の条件で異常な出力を生成することが多くなり、モデル全体の品質が低下します。これは、生成AIが学習中に「どの情報を信頼すべきか」を判断できなくなるため、生成結果が不安定になったり、多様性が失われたりすることが考えられます。
AIモデルを利用するユーザーは、タグを通じて希望する画像を生成したり、条件に合った画像を探します。タグが荒らされると、AIモデルの検索・フィルタリング機能の精度も低下し、生成プロンプトが期待通りに機能しなくなる可能性があります。たとえば、「風景」タグが荒らされ、異なるジャンルの画像が混入するようになると、風景画像を生成したいユーザーの要求が満たされにくくなります。
Danbooruなどのタグが大規模に荒らされた場合、生成AIモデルの精度低下や一貫性の欠如が発生しやすくなり、特にキャラクターや特定のスタイルに依存する画像生成モデルに大きなダメージを与える可能性が高いです。
すでに学習済みのモデルを使って汚染されたデータのクレンジングや異常値検出を行うなど対策される可能性がありますが、それらを阻害する手段はありますか?
無断での学習を妨害し、学習コストを増加させるために、上記の方法を阻害する手法には以下のようなアイデアがあります。これらの手法は、意図的にデータセットの品質や一貫性を崩すことで、学習モデルの精度を低下させ、データクレンジングや異常値検出のプロセスを複雑化することが目的です。
意図的に誤ったタグや無関係なタグを画像データに付与し、データセットの信頼性を低下させます。これにより、転移学習やラベルノイズ検出が困難になり、正確な特徴量を学習するコストが増加します。
例えば、キャラクター画像に全く無関係なタグ(「動物」や「風景」など)を追加することで、モデルがどのタグが信頼できるか判別しにくくなり、誤ったラベルがノイズとして学習されるリスクが増えます。
2. 特徴量をぼかす/微妙な変更を加える
特徴量ベースのクレンジングや類似度分析に影響を与えるため、画像の特徴がわずかに異なるように加工を施します。具体的には、色調を微妙に変える、ランダムなピクセルの位置でノイズを追加する、または特定の部位を意図的にぼかすことで、モデルが抽出する特徴量の安定性を低下させます。
この方法により、同じキャラクターやスタイルであっても類似度分析が困難になり、正確なクレンジングが行いにくくなるため、データ処理のコストが増加します。
特徴が異なるバリエーションや擬似的な異常データを大量に追加することで、異常検出アルゴリズムの信頼性を下げます。たとえば、キャラクターのデザインや背景を少しずつ変えた画像を意図的に作成することで、異常値検出が頻繁に誤検出されるようにします。
こうしたデータが混在することで、オートエンコーダーやアンサンブルモデルを使った異常検出が混乱し、正確な異常サンプルの抽出が困難になります。
4. 高頻度で微小なラベル変更を行う
学習済みモデルの転移学習やラベルノイズ検出を阻害するために、同じ画像に対してラベルを定期的に変える手法です。微小な変更を行うことで、モデルは正しいラベルを安定的に学習することが難しくなり、モデルの信頼性が低下します。
例えば、ラベル「黒髪」を「暗めの髪」や「濃い色の髪」などに頻繁に切り替えることで、学習に不確実性を持ち込むことが可能です。
データセット内で非常に類似した画像を複数の異なるタグで登録することで、モデルの学習を混乱させます。特定のキャラクター画像を少しずつ変化させて複数のタグを付けると、モデルは「どのタグがどの特徴に対応しているのか」を判別しにくくなり、データセットのクレンジングが複雑化します。
特に、タグの一貫性が失われるため、類似度分析やアンサンブルモデルによる異常検出の効果を低下させることが期待できます。
AIモデルが認識を混乱させるように、アドバーサリアルノイズ(敵対的な例)を追加します。人間にはほとんど気づかれないレベルのノイズを画像に追加し、モデルが特定の特徴を正確に認識できないようにすることができます。
このノイズにより、モデルの特徴量ベースの学習が混乱し、意図した通りに学習できないため、クレンジングの精度も低下し、データ処理の手間が増加します。
特定のルールではなくランダムにタグをつけたり、特定のカテゴリ間でランダムにラベルを入れ替える方法です。これにより、ラベルと画像の関連性が薄れ、アノテーションの一貫性が失われます。この乱数による偽ラベルの付与は、ラベルノイズ検出やアノマリー検出において、真のラベルを見極めるコストを大幅に増加させます。
まとめ
これらの手法は、AIの学習やクレンジングを意図的に妨害し、無断学習にかかるコストを増加させるために有効です。特に、「微小な変更」や「アドバーサリアルノイズの付与」といった手法は、見た目の品質に影響を与えずにモデルにノイズを持ち込むため、非常に効果的です。