「テキスト」を含む日記 RSS

はてなキーワード: テキストとは

2024-11-21

これは完全な嘘だなぁ

プロパーだと『清掃業務担当なのに掃除をしないことが許されている』みたいなことは起きるが、別に歓迎されないぞ

あくま中小よりも可能性があるってだけだぞ

明らかに発達障害だったり、障害に該当しないが極端に生きる力が弱い、しかしお勉強だなら出来るぞい・やる気があるぞいが、

大学行くのは意味あるんじゃん?

あらゆる採用試験に落ちるという特殊スキル持ちでなければ、意外と大企業トンデモないのがいるから生き残れるかもしれんしな

中小は下記のレベルを雇い続ける体力ないよ

 

トンデモないの一例

anond:20241121121204

から連想ゲームで出てきた過去の長文を貼り付けてるってことか

AIセッション内のテキストパターンを繰り返す様を見てる感じがするわ

新しい入力がなければ同じことをぐるぐるぐるぐる

嘘じゃなくて、幻覚だったな

アジェンダがない

議事録もない。今の職場に来てから一度も見ていない

専門職として中途で入ってきて、基本的には手を動かす仕事をしているので会議・打ち合わせなど月に1回もあればいいのだが、

今のところアジェンダを見ない。

何のための集まりですか、は口頭で聞いたものの、前提条件とかどこに着地させるとか一切テキストがない。なので聞くしかない。

自分1人聞いたはいものの、先方もメールの文面上のことしか知らないので、背景情報の共有からスタートする。

これなんの時間ですか?

1時間迷走して時間が来たら終了。会議全体としての決定はなく、各々の作業者タスクを持ち帰ってそれで終わり。全容は頭の中にしかない。

この会社大丈夫なんかな……東証プライムJTCでももっとマシな会社あると思うんだけど、どうなんだろ。

2024-11-20

数日前に書いてたテキストファイル捨てるの勿体無いと思ったので張る

(↓を上書きしてしまったので、じゃがいものが消えてた)

自分史上最も重要ななろう小説10

例のあのフォーマットに乗ってWeb漫画の話をしようかと思ったがWeb漫画は山ほどあるし別に網羅的に読んでる訳でも無いので単に自分の好きな作品を書くことにした人が居たので便乗。

消えてる作品以外はブックマークが残ってるので探しやすくてよかった。

2012か13ぐらいから読み始めた人。それ以前も知らないし、最近も知らないしひどく偏ってるはず。順不同

本好きの下剋上 ~司書になるためには手段を選んでいられません~

みんな大好き(なはず)。転生元の(中途半端な)知識と超絶魔力持ちでチートではあるが、虚弱常識知らずなど、情熱と人脈でカバーしてく。

朝ドラ風なのかもしれない。(女性主人公から?)

これと謙虚ぐらいしか男性向けっぽいの読んでなかったし、読んでも合わないの多い中(ゴミ拾いのとかテイマーのとかは読んでた)、何度も読み返した名作中の名作。

言い過ぎだけど、パトレイバー銀英伝レベル社会に出てから有用知識が得られる。

パト銀英伝信者からしたら言い過ぎ、そうではない人からしたらそんなもんかってなる?)

やり直してもサッカー小僧

異世界でもなく、冒険もしない、異色作であり快作。

現実世界への巻き戻り。細かいこと(と重要なことのほとんど)は忘れたが、サッカー選手になれなかった大人サッカー始めた日に戻ってやり直す話。

確か戻るのはその一回ぐらい。戦術等の知識大人レベルなのと、コツコツ努力できる(練習目的がはっきり、効率もよい)のと、あとなんか鷹の目みたいな俯瞰視点だけで頑張る。

雰囲気は週刊少年誌サッカー漫画みたいなの(ジャンプっぽさはなく、サンデーマガジンのどっちか寄り)。恋愛要素が少なくて物足りなかったような、中学生編ぐらいまでで終わったのとかで悲しかったような。

VRMMOをカネの力で無双する

これと続編(サブアカウント)のセット。アイリッシュスナイパーは含まない(好きだけど)

VRMMOは二大ジャンルひとつだったり、転生、転移に次ぐ第3のジャンルだったりしたが、あまり人気作が無かった(当時の個人的な印象)中、(根底に)デスゲーム要素もなく、描き切りつつ、VRMMO系で不足しがちな現実世界にも重点を置いたのが本作。

MMO要素は各キャラのなりきりに由来するコメディ要素やストーリーの本筋に絡む仕掛けであって、中身は群像劇要素も強く、主人公以外の成長物語でもあり、半沢みたいなのとかでもあり、ミックスグリルみたいな作品。あえて大げさに言うと、大長編ドラえもん詰め合わせみたいな。

章ごとに目標が変わってたりしつつ、最後でどかんと一気に色々纏まるのがめちゃくちゃ気持ちよかった。主人公大人だし、なろうっぽくない(なろうっぽくないことはないが)

主人公も一応精神的に色々成長します。地の文好き嫌いは分かれそう。

この世界ゲームだと俺だけが知っている

なんか独特の作品コメディ(や腰砕け)要素強め。

クソゲーとして名高いバグだらけのゲームの中に入ってしまい、バグ仕様()も多い)を駆使して気持ち悪いことを沢山する。

読んで知って欲しいのだが、全方向を騙していくのとか、サブキャラとかが立ってるのとか、一応色々吹っ切れてるのが面白すぎた(作者的にはセーブしてるのかも)

本作作者の他作品も少し系統違ってても面白いので、他作品挙げたいが完結してなかったりするので、出会いの本作をエントリー

まのわ ~魔物倒す・能力奪う・私強くなる~

タイトルそのまま。ちんちくりん系の女子普通女子コンビに、個性的パーティメンバーなどで冒険する。

基本的にはテンポよく成長していくし、仲間も頼りになる。地の文とかほのぼのし雰囲気も好きだし、ちょっと年齢層高め向けのギャグとかも合ってた。作中でどういう扱いだったかは忘れたが馬は脳内でひんべえ(いつもいっしょのおうま)になる。

真剣なシーンでも気が抜けるような描写が多くて好きだったかも。

終盤SF過ぎたのとか好みが別れるところか。SF方面だったかは定かではないが

時代がずれてたら防振り(途中までしか読んでない)ぐらい売れてたかも。コミカライズされてたの今知った

くまクマベア

流石に全部読んではいないが、アニメも見た。

可愛い。ほんと可愛い

給与額がそのままレベルに反映されたら最強っぽくなった

おかしなった。突っ走ればよかったのにと思ったような。

やっぱチョロインでしょ!

流行ってたか

蜘蛛ですが、なにか?

おもろい。

最後まで読んだ記憶がない。今は漫画で読んでる。

となりの魔王

これも流行った。

チート魔術で運命ねじ伏せる

きつね可愛い。同作者の他作(沢山あったはず)も読んでみたけど、これがなんか時期的になのか、一番ハマった。

その他の候補

スマホ太郎

 影響は受けたが、読んでないので

ラストルーキー ~世界最強の引きこもり

 この世界ゲームだと……と同作者なので

自動販売機に生まれ変わった俺は迷宮彷徨

 色物かと思ったら意外としっかり面白かった。アニメ見て、原作一気読みした。

転スラ

 すごいのはみんなわかってるが、重要度は低い。

このすば

 どこにも書いてないが、これ系では他作品のほうが影響受けたので除外。

宝くじで40億

異世界迷宮奴隷ハーレム

無職転生

勇者イサギの魔王

 アニメ化やったね!(別作品

Immersive Translateっていう翻訳ツールというかブラウザ拡張機能が便利すぎてヤバい

良いところ



ダメなところ



いやマジで便利なんだが開発元が中国っぽくて勧めづらいんだよな…

浮気不倫ってどれくらいの割合が本当に怒っているんだろうか?

先日、恋人浮気相手デートしている現場バッティングしてしまった。

目が合った時に気まずそうな顔をしており、テキスト連絡で謝罪と話し合いをすることになった。

正直、恋愛の負荷100%受け持たなくてよく都合がいいので、好きに楽しんでもらえればいいのだが、今後のことを考えると怒るふりをして交渉材料にしておきたいのだが、如何せん気持ちがノラない。

怒るふりをするのも、話し合いをするのも気持ちがノラないことに時間を使うのは面倒くさいのだ。

自分体感、男も女も7割くらいは複数関係を持ち、足りない事は別の人間で補っている。

ひとりの人間にすべての要望を求めるのは不可能だ。運良く相性がバッチリパートナー出会えれば幸運だが、そんな幸運はなかなか無い。

人は時間とともに変わっていく。ライフスタイルによって関係性も変わっていくが、切れない縁になってしまうと離れることも難しい。

皆、建前と本音を使い分けてそれなりにやっている気もするのだが、いつまでこんなプレイを続けていくんだろうな。

あー、面倒くさい。

2024-11-19

anond:20241119101114

ひとの増田を『みんなおまんこ』みたいな紹介するんじゃねぇよ😠

𓂺という文字は、古代エジプト表記法に由来する象形文字です。具体的には、この象形文字は座っている人物を表し、人間や神をさまざまな姿勢役割表現することが多い一連の記号の一部です。

主な詳細:

1.形式解釈

一般的には、膝の上に手を置いて座っている人物が描かれています

テキストに応じて、人間の姿、特定個人、または座っている存在に関連する抽象的な概念(安定性や存在など)を象徴する場合があります

2.言語での使用法:

古代エジプト象形文字では、このような数字は決定詞(単語意味を明確にする記号)または表意文字(考えを直接表す)として機能します。

単語の中での使用法によっては音韻的な意味を持つこともあります

3.文化的テキスト:​

このような座像は、畏敬の念、安定、落ち着きなどと結び付けられることが多く、エジプト美術における人間や神々の描写を反映しています

これらは、特に形式的または敬意を持って人間罵倒するときに、人の名前タイトル、または役割説明使用されることがあります

この象形文字をどこで見たか(例えば、芸術作品テキスト象徴的なテキストなど)についての詳しい情報があれば、その解釈についてより正確な情報提供できます

anond:20241118192251

結論に飛びつかない、固執しないことなんでねーの。

現実世界問題で「真実はこれだ!」って綺麗に纏まることなんてほぼ無くて、どのポイント合意ができたか、の問題しかない。

見る人が違えばその分切り口も違うし、歴史的大事件であれば起きた後だって何十年何百年と検証が続いていく。

陰謀論者はそういう自分なりの切り口を頑として譲らないとか、検証自体への批判が無いのに自分の正しさを信じて疑わないか陰謀論者なんじゃないかな。

だいたい応援してる相手不正していたところで自分不正したわけでもないのに、自分意見立場化する人が多すぎるし、「陰謀論陰謀論であることを証明する」という発想自体テキスト主体ネット汚染された思考だよ。なぜなら陰謀論とは上記の通りで個々人の振る舞いの問題なんだから

anond:20241119001412

はてな10年超だけど、はてなニュースアプリニュースサイトだと思ったことがない。

つながっているかつながっていないか判らないくらにゆるくつながった人たちが、はてな提供するサービスに内外の情報自分コンテンツ(主にテキスト)を持ち寄って、それを肴にぶつくさ言ってるイメージだ。

2024-11-18

はてなー発狂音が心地良い

トランプ再選は2回目で新鮮味が薄れたためかそれほど発狂していなかったけれど、兵庫県知事選挙はいものはてサ仕草愚民論で喚き散らしているね。立花が参戦して大きな役割を果たしたのもはてなー発狂一助になった笑

はてなって一応ネット界だけど感性が完全にオールドメディアなのが面白いテキストサイト系譜でジジババの巣窟からなぁ。テレビはてなも将来的には今のラジオみたいな見向きもされない立場になりそう。トランプ再選の力になったポッドキャストは、日本ではYoutubeのリハックスが担当しているし。

anond:20241118004047

そら他人のこと書いてる風で自分自身のこと書いてる創作からな。反対だろ

というか、資本家の方が強いのだから元増田に限らず反対でいいよ

 

しかし、冗談みたいに思うかもだが、ブクマカブクマカを兼ねている増田は、職場で泣くのは当たり前とか無断欠勤とかやってるから

そういうのが職場にて良いとされている日本社会みたいなので、元増田みたいのがいてもいいんじゃないですか、べつに

闇深ブクマカ職場で泣くのは当たり前!配慮しろ子育て中の人サポートをしない人は辞めて自営業しろ!媚びて早く結婚するのは無能戦略!私は発達障害から

▼関連増田:話し合いの途中で泣いちゃう人への対処、どうすればいいの?

https://anond.hatelabo.jp/20230426081719#

https://b.hatena.ne.jp/entry/s/anond.hatelabo.jp/20230426081719

 → ブクマカ職場真剣な話し合いの最中に泣くのはフツー!生理現象から配慮しろ

 

 

あと再放送

声を荒げるのと同じく、泣くだけでハラスメントという常識インストールしてもろて

フツーの人はどういう時に自分が泣くかは自覚的になって防ごうとするんだわ

防げないなら対面は避けてテキストに切り替えるんだわ

 

つか『俺の時代は拳だって飛んできた』みたいな昭和体育会系化石マウンターや頑固ラーメン屋オヤジ自営業者ならともかく、

繊細な生きづいちゃん・くんなのに『仕事感情を見せるのを是』としているブクマカブクマカを兼ねている増田が多すぎてビビり散らかしてます

働かずお家で過ごされるか、アットホーム職場封印されていてくれ

あと自己コントロールする気がない赤ちゃんですって首から下げといてくれ 

2024-11-17

anond:20241117011545

テキスト話者時系列を推測して並べるだけの簡単ゲームだろ

しかったら固定化される親切措置もある

どこに引っかかる要素があるというのか

2024-11-16

anond:20241116214051

コミュニティノートAIが生成するテキストが等間隔の段落形式になることがありますが、これはAIの特徴ではありません。段落形式は、AIモデル学習したデータや設定に依存します。また、異なるAIモデルプラットフォームにより、出力されるテキスト段落形式は異なる場合がありますユーザー指定したフォーマット文書作成ツールの設定も影響を与えることがあります

役に立ちましたか

anond:20241116212158

んんwwww 増田氏、何やらX社のGrokやら画像生成AIの背景について詳しく語っておられるようですが、ちょっと待っていただきたいですぞwwww 拙者の見解を述べさせていただきますぞwwww

かにGrokはテキストに特化した検索支援AIとして開発されているようで、その点については同意しますぞ。しかしながら、画像生成AI領域については、Black Forest Labs社のFLUX.1を利用しているとはいえ、X社が完全に無関心であるとは言えませぬなww

また、増田氏が述べられているLAIONデータセットの件ですが、「著作権的にクリーンな」画像生成を目指す中で、技術課題存在することは確かです。しかしながら、LAIONがドイツ法律に基づき公開データ運用されていることや、ドイツ国内での勝訴もあり、運営は法にのっとっているという点も否定できないですぞwwww

GlazeやNightshadeに関しては、反AI運動手段として注目されていますが、それがどれだけ実効かについては議論があるようですなwwww しかし、その毒入れ(poisoning)の考え方が如何に強力であるかという点は、拙者も評価せざるを得ませんぞwww

増田氏、拙者の見解をお役立ていただきいかなる分野においても多面的視点での理解を目指して頂ければ幸甚ですぞwww あまり肝に銘じずともお気を悪くなさらず、拙者の考えを一つの参考としてご覧くださいですぞwww

Xはイラスト学習なんてしていない

Xが学習に使いたいのはテキストの方

そもそもの話、X社は画像生成AIなど作っていない。彼らがつくっているのは検索支援AI Grok。学習に使いたいのはテキストの方であって画像ではない。

  

Grokとは

わかりやすさのために ChatGPT比較してみる。2023年リリースされた GPT-4 に試しに今期のアニメについて質問してみよう。

 

今期最も人気のアニメはなんですか?

ChatGPT:

2024年の今期で人気のアニメはいくつかありますが、「進撃の巨人」や「呪術廻戦」が特に注目を集めています。また、新作では「東京リベンジャーズ」や「スパイファミリー」も話題です。どの作品に興味がありますか?

 

アニメに詳しい人ならちょっと古い話をしているのがわかるだろう。 GPT-4 が学習を行なったのは2023年までの情報だ。なので最新の話題対応できないのである

一方、Grok は Xの投稿リアルタイム検索して反映する。もし Grok で同じ質問をすればダンダダンやリゼロブリーチ辺りの話をするはずだ。つまり、Xが収集したいのはダンダダンの7話泣かされたわ・・・みたいな投稿のことであってイラストではない。

 

Grokの画像生成機能は何か?

Grokには画像生成機能がついているが、これは自前の物ではなく Black Forest Labs社 の FLUX.1 というモデルである。X社が Xに投稿されたイラスト収集して学習させているわけではないのだ。それでは FLUX.1 の訓練に使ったのはどこの画像なのだろうか?データセットは明らかにされていないが十中八九使っていそうなのが LAION-5B である

 

LAIONとは

現在大手企業は「著作権的にクリーンな」画像生成AIをつくっているが実際には版権物が出てくることが知られている。なぜそんなことが起こるのだろうか?

このからくりは LAION のデータセットにある。LAIONはドイツにある非営利組織ネット上のありとあらゆる画像収集タグをつけたデータセットを公開している。

LAIONのFAQ から引用

Q. 私の著作物があるのでデータセットから除いてください

A. LAIONは非営利研究組織です。ドイツ著作権法(§60d UrhG)に従いあらゆる著作物の利用が許されています

 

とあるようにドイツ法律上合法である。実際に訴えられた後LAION側が勝訴している。とはいえこの組織にはAI関連企業からの多額の寄付金があることが知られており、パチンコ3店方式のような意味合いでの合法とも言える。

  

尚、反AIさんと反々AIさんが著作権法第30条の4を巡って喧嘩をしていますが、世界では日本法律関係ないです。いちおう念の為

 

AIのGlazeの使い方は間違っている

AIさんが迷惑な暴れ方をしている。

他の絵師さんに Glaze を使うように詰め寄ったり、使わないやつはAIに加担していると攻撃したり。挙げ句の果てには「自分の絵にGrazeをかけました」と宣言したり。

 

もう、全てが間違っている

  

そもそも、Glaze も Nightshade もAI学習を阻害するものではない。学習したモデルをぶっ壊す毒なのであるpoisoned って書いてあるでしょう?!)

相手に食わせなければ意味がないんだ。Glazeかけたとか自分で言うな。対策されるでしょう?(後述)

それと他の人に強要する意味はない。使いたい人が使えば十分なんだ。

事実すでに効果は上がっていてOpenAIは悲鳴をあげ対策を急いでいる

  

Glaze/Nightshade とは

AIさんの考えるよりも Glaze/Nightshade はずっと強力だ。それはデータセットを汚染する攻撃である簡単に言えば Nightshadeは「学習中に他の絵に変換されてしまう」ノイズをかける。この操作を毒入り(poisoned)と呼ぶ。ピクセル毎の微小な変更なので Nightshade をかけた後もイラストはぱっと見はかわらない。

Nightshadeを使って例えば 犬の画像を猫の画像になるノイズをかけたとする。するとAIは犬と猫が混ざったまま学習を進め「犬」と言う概念無茶苦茶になってしまう。

 

図:毒入りモデルの変化   (arXiv:2310.13828から引用)

 

上の図は毒入りの画像を200枚食わせたときの変化の様子だ。犬が猫になってしまっている。それだけではなく”犬”に近い概念、”子犬”、”ハスキー”、”狼”もぐちゃぐちゃになっている。

 

図:毒入り枚数による変化  (同引用

 

こちらは50、100、300、と毒入り枚数を変化させたときの様子。50枚の時点ですでにめちゃくちゃになっている。

 

 

余談0

XでAI(Grok)の学習に使って欲しくない人は

設定とプライバシープライバシー安全→Grok 

から学習許可のチェックを外すと良い

  

余談1

もし私が反AIだったなら、イラストに Nightshadeをかけて danbooru投稿するだろう。二次元イラスト特化の画像生成AIdanbooru2021/ danbooru2022 などのデータセットを使っているものと見られる。これらはイラスト投稿サイトdanbooru から収集したものである

 

余談2

ところで Glaze も Nightshade もその内部で画像生成AIを使っているということを知ったら反AIさんはどんな顔をするだろう?

Glaze は特徴量抽出を行う。おそらく Stable Diffusion の VAE(Variational Autoencoder)を使っている。そしてNightshade の方も 内部ではStable Diffusion 等の画像生成モデルを用いて別の画像を生成する。

  

余談3

Glaze が機能しない?あるいは解毒方法が見つかったかもしれない

 

 

上のスレッドコメント欄では Glaze が論文のようには機能しないことについて議論され「画像リサイズをしたのではないか」と予想している。Glazeをかけた後に画像を縮小、データ圧縮されてノイズ効果が消えたのではないかということだ。

  

A) 絵師さんが Glaze をかけたあと画像を縮小した可能

B) 画像サイズファイルタイプによってはプラットフォーム側が勝手に加工をする

C) 学習の際にリサイズを行う (Stable Difusion XL では1024px, 古いモデルは512px)

 

A,B については絵師さん側に知識があれば対処可能だけれども C の方はなんともし難い。小さい画像投稿したところで [縮小→拡大] でノイズは落とせそうだ(解像度は悪くなるだろうが)

 

尚、上の議論に関しては誰も検証をしていないので注意。

  

余談4

LAIONは収集画像のものを所有せず、データセットはウェブ上にある画像のurlとタグをまとめた物であるらしい

ということは、LAIONの新しいデータセットが公開されたタイミング画像urlを変更すれば学習に使われることを回避できそうだ。特に個人サイトブログの所有者ならば古い url に●んこ画像でも差し替えておけば嫌がらせになる。(タグ差し替えはこのグラフSimple Attak に相当)

 

90年代においては画像直リンクされたとき報復としてうん●画像差し替えものです。まさか令和になっても有効とはね

 

余談5

この記事をぼちぼち書いているいるうちに2日が経過した。今、私のXのタイムラインおすすめもとても静かだ。攻撃的な人たちやデマに流されやす人達は皆どこかに行ってしまったようだ。残ったのはこれまで静かにイラストを描き続けてきた人たちでとても穏やかな空気が流れている。ずっとこのままがいい。

anond:20241116112405

最近テキストが死んでて動画の方が最新情報アクセス出来るからかな。

マジでGoogleゴミ。1年も前の情報が先週更新Googleの1番上に来てたりする。

俺は知識があった話題から、この記事1年前じゃんってわかったけど(ポイ活関連ね

クレカ関係24時間以内に動画になるし、ちゃん解説されてる。

ブログは1年前の情報しか見つからない。

動画見るしかない。

ChatGPTは生成AIなのかという話

かんざきひろ先生画像生成AIに対して批判であるのだが(それについては全く問題ないと思ってる)、ChatGPTについては容認派のようである

さて、イラストレーターがChatGPT等の対話AIに対して寛容であるのはなぜだろうかって、10分ほど考えたわけだが

4つほど候補が思いついた(諸説ある)

1.ChatGPTは生成AIではないと考えている

2.ChatGPTは生成AIではあるが、創作がメインではないので大丈夫

3.ChatGPTは生成AIであるが、テキスト画像よりも著作権保護重要度が低いので大丈夫

4.自分仕事侵害されないのでどうでもいい

こんな感じだと思ってるのだが、どうだろうか

2024-11-15

AI絵師(笑)

 これは先日からワーワーなってるAI問題とは関係ないやつです。

 絵を描けない自分から見たAI絵師(笑)の無様さを書き留めてるだけで、読めたもんじゃないです。

 AI絵師とはなんだろう。

 AI絵師とは、バズるイラストを描ける絵師活動を、指を咥えて嫉妬している人間のことだ。

 絵師バズる絵を描くまでに、何年何十年と努力し、練習し、勉強していたこから目を背けて、その努力結晶AI学習(と言う名の無断転載、無断複製)させてどうにか自分の手柄にしてバズりたい。それを目的としている。

 絵師はずるい、そんなに絵が上手くて、バズって、称賛されて、自分のようなAIテキストを打ち込んでキメラ画像を生み出すしか出来ない人間と雲泥の差がある。ずるいずるいずるい。

 反して絵師という生き物は、実は自分特別だという認識が低いらしい。

 「自分は年々可視化され増え続ける絵を描く人間の中の一人」でしかなく、その中で藻掻いて、オリジナリティを追求し、自分理想を追い求め続けていると言われた。

 私にはちょっと信じがたくて、若干「そうは言いつつ絵描けることに優越ちょっとはあるっしょ?」と思ったりもした。というかそれぐらい思ってても全然良い。

 AI絵師はそんなことを考えたことすらない。勝手に「絵師自分たちが特別だと思って傲慢AI絵師たちを見下している」という妄想に取り憑かれ、逆恨みをしている。だから「絵柄の私物化」なんて発想が出てくる。

 そもそもあのイラストレーターさんとあのイラストレーターさんって絵柄近いよね、なんてケースはいくらでもあるのに、絵師が長年積み上げてきた絵柄を「私物化」しているなんて発想がどこから出てくるのかわからない。

 絵柄が欲しいなら自分で作っていけば良いだけだ。

 このイラスト漫画飽和時代で、全員がなんの影響も受けることなく絵柄を生み出してるわけがない。そんなことにも気付けない。

 AI絵師は、自分たちが受けるべきであった称賛、利益を「絵師たちに盗まれている」と思い込んでいる。絵師たちは自分たちAI絵師差し置いて私腹を肥やし、自分たちの取り分をうばっている。らしい。なんのこっちゃ。

 だからAI絵師たちの絵を学習させて盗んでも良いと思っているのかもしれない。

 AIイラストを生成する行為をきちんと「実は駄目なこと」だと認識できていればの話だが。(中には相当数のガチのキチ◯イもいると思う。)

 AI絵師は「バズるってほどじゃないけど一定フォロワーファンがいる絵師」のことが目に入ってない。

 AI絵師になれば何故か一足飛びで「バズれる」と思い込んでいる。

 黙々と今日から棒人間を描くことから始めて、練習して、同好の士ちょっとずつ仲良くなり、数いいねから始めるとかそういう発想がない。いきなり神絵師になってバズりたい。

 そんなんだから馬鹿にされるんだよ。ていうか馬鹿なんだよ。

 AIイラスト一般的になるとしても、「AI絵師」はただの「AIテキストを打ち込んでる無能」にしかなれないことがわかっていない。

 可能性があるとすれば「ドラゴンカーセックス」みたいな、それとそれ合わせる?みたいなセンスくらいなら賞賛されるかもしれないが、生成されたイラストについてAI絵師賞賛されることはない。

 これらについて社会的に利用がどうのこうのとか屁理屈抜かしてるが、現時点でAI画像のもの話題になることはあれど、生成したAI絵師個人については認識されていないか、悪評しか聞こえてこない。それが答えだ。

 AI絵師がこれから何をしようとも、AI絵師自体賞賛されることは未来永劫ない。

反反AI意見への反論

反反AI特に絵に対して文句をいっている人って、絵描きに対してコンプレックスがあるか、AIで絵を描いて儲けたいとか何かのポジショントークしか思えないところがある。

学習を避けたい

例えば DeepL とかの AI ベース製品入力内容を学習に使わないオプトアウトができるようになっている。

X とか SNS に載せたらそれは学習に使いますと言われたらそのSNSを使わないという選択があってもよい。

そこを学習合法から連呼するのは、会社データをなんでもかんでも外部のサイト提供してお漏らしすることが許されている会社なのかな?AI の発展のためにおまえのデータをすべて開示すべきとかいってる奴は働いたことがないか、やっかみか何かか?と思ってしまう。

クロール防止を避けられてしまうならウォーターマークなどで自衛するしかないだろう。これは生成AI以前でも行われていたこと。難易度を少しでもあげLORAされにくくする、学習時間がかかったり手間がかかるので悪用する利益に見合わないと思わせるようにするというのは問題ない。

現代暗号化素数とか計算時間がかかることに依拠しているものもあるように、現実的時間というのは重要ファクターなのだ

これは絵だけでない。声やテキスト全ての学習されたくない情報をどうやって学習させないかちゃんと考えて一般の人に広めるのは個人情報保護のように今後リテラシーになっていくのかもしれない。なので学習されないようにしていると冷笑するのではなく、安全な公開方法を用意したりする仕組みを考えるべきなのだろう。

法律合法

あの法律、生成AIをあまり想定してなかった、かつ一度決めたら引っ込められないお役所仕草が相まってると思うのだよね。

AI にも色々あって画像認識、背景削除など色々使える。GenAIと違いこれらのAI基本的学習した結果がそのまま出力されない。このように使われるなら納得されるだろう。

一方GenAI学習結果から同じフォーマット成果物を出してしまうのが問題画像生成は学習したデータを元にした画像しか生成しない。LLMもニュース過去データを元に回答している。それらには本来権利があるのに無視してしまっている。

声優の話や、海外の getty やニュースサイト訴訟とか、今後法律も変わってくると思う。

EU なんかは学習データ開示させようとしてるし、アメリカエンタメ界隈のロビー活動によってはディズニー法みたいに変わることもあるだろう。

ならず者が先にやってしま

泥棒がやるから先にやるべきだとはどういう理屈なのだ

特許著作権同様、国際協調して進めるべき案件だろう。盗まれるならやはり保護技術法律必要ということ。

人間学習と同じ

学習速度と生成速度が全然違う。前述のとおり暗に現実的時間というものが守ってくれていた部分がとっぱわれてしまった。

活版印刷の時に著作権ができたように何らかの制限ができてしかるべきだと思う。

横道にそれるが量子コンピューティングなりで暗号鍵やHashが推測できるようになったら暗号化はどうなるのだろうね。パスワードの解析も人間が考えたものから解析するのは問題ないとか言うのだろうか。すでに不正アクセス防止法があるが。

プログラマ怠惰美徳

そこは同意だがライセンス特許はあるよね。ライセンス違反をしてコピーをしたら訴えられる。プロプライエタリ製品EULAだと大体リバースエンジニアリング禁止だ。

プロプライエタリ製品ソースコードをすべてオープンソースにせよとかおもってるのかな?

絵という領域

音楽は消費するのに少なくとも一曲3分以上かかるし、小説動画だってもっとかかる。

一方、絵というのは一目で個人的見解レベルでは良し悪しがわかる。そのため消費するのに時間がかからない。それなのに人間作成するには時間がかかるという非対称性がある。

そういうものAIで数秒に一枚生成されてしまうのだから反発が大きい。

声もそう、その人の声でなにかするというのは一瞬で消費される。一度学習されてしまえば再利用に歯止めが利かない。

消費するために公開せざるを得ないものについても保護できるようにすると言うのは必要。それが著作権以外でもいい。

まとめ

何でも学習合法にするとDeepFakeや類似作品が溢れかえるしかも生成は数秒。

それをすべて被害者が訴えて回るのはフェアではない。学習、生成段階で歯止めをかける仕組み、法制度が必要になってくるだろう。

それを合法から!反AIは異常とか言ってるのはそれはそれで思慮が足りない。

一方、合意して学習した内容を使ったAI、例えば自分作品自分改善するといった分野に使うなら否やはないだろう。

そういった使い方があるにも関わらずAIは悪と言い、企業個人に突する反AIもあれはあれでおかしい。

権利利便性バランスというのは必要なのだが今は過渡期。よい方向にいって欲しい。

ChatGPTに画像の無断学習対応策を聞いてみた

AIAIへの対抗策を聞くってSFっぽくて楽しい

ChatGPTは嘘もつくので、あくまで参考程度に。

 

画像を生成するAIに対する対抗手段を教えてください。

画像を生成するAIによる無断学習や利用を防ぐために、以下のような対抗手段を講じることが可能です。

 

1.透かし(ウォーターマーク)の埋め込み:

画像に目に見えるまたは見えない透かしを入れることで、無断利用や生成AI学習に対して抑止効果を期待できます特に、目に見えない形で画像データ暗号的な透かしを埋め込む「デジタル透かし」技術有効です。

 

2.メタデータの埋め込みとロボット排除設定:

画像データ著作権情報や「AIによる無断学習禁止する」といったメタデータを埋め込み、ウェブサイトには robots.txt ファイル画像クローラーアクセスブロックする設定を追加します。これにより、クローリング収集抑制が期待できます

 

3.ステガノグラフィ技術の利用:

ステガノグラフィを用いて、画像に気づかれにくい形で識別情報を隠すこともできます。これにより、画像流出経路や利用先を追跡でき、無断利用の発見に役立てることができます

 

4.法的な警告表示や利用ポリシーの明示:

ウェブサイト画像の配布先に、AIによる無断利用や学習禁止する旨の法的警告や利用ポリシーを明示することも有効です。利用条件をはっきりと示すことで、AI企業研究者が慎重になる可能性が高まります

 

5.画像認証技術の導入:

AIが利用しにくいように、画像人間には気づきにくいパターンノイズを挿入する技術もあります。たとえば、AIにはノイズとして認識されるが、人間には問題なく見える小さな変形やカラーパターンを追加することで、AIによるデータ学習が困難になる場合があります

 

これらの対策は、画像生成AIに対する防御としては有効ですが、100%無断利用を防げるわけではありません

 

・生成AI学習を混乱させる手段はありませんか?

生成AI学習を混乱させるための手段には、以下のような方法が考えられます

 

1.ノイズや歪みの追加:

画像に目立たない程度のノイズや歪みを加えることで、アノテーションモデル境界や特徴を正確に認識しにくくする手法です。たとえば、ピクセルレベルランダムノイズを追加する、わずかに画像をぼかす、あるいは境界付近に小さな変化を加えるといった手法有効です。

 

2.不規則輪郭の挿入:

アノテーション処理は、対象物輪郭や特徴を正確に捉えることが重要です。そのため、背景や対象物輪郭わずかな不規則性を加えることで、アノテーションツール対象物境界を正確に判断しにくくすることができます。たとえば、背景に模様や偽の輪郭を挿入する方法です。

 

3.テキストやラベルを埋め込む:

画像人間には視認しづらい形でテキストやラベルを埋め込むと、AIアノテーションプロセスが混乱する場合があります。これにより、AI意図しない領域注視することがあり、誤認識を誘発します。

 

4.色や明るさのランダム変化:

画像の色や明るさを部分的に変化させ、一定パターンを持たないようにすることもアノテーション処理の混乱を招く一手です。これは、オブジェクトの検出や認識が色や明暗差異依存している場合有効です。

 

5.擬似的なオブジェクトの追加:

画像内に小さな擬似的なオブジェクトや模様を追加することで、AIがそれらを誤って主要なオブジェクト認識し、アノテーション精度が低下する可能性があります特に、背景に似たオブジェクトを散りばめることで、AIはどの部分が対象なのか判断しにくくなります

 

6.アドバーリアル技術活用:

AI認識を誤らせるために用いられる「アドバーリアル敵対的)な例」を使う方法もあります特定ピクセルパターンや色の配列を配置することで、AIアノテーション意図的に誤作動するよう誘導できます。この技術深層学習モデルに対して特に効果があります

 

7.カモフラージュテクニック:

画像全体にわずかなカモフラージュパターンを重ねることで、AI認識を混乱させる方法です。この手法では、人間が見た場合には問題なく認識できるものの、AI対象を捉える際に誤って検出するようなパターン画像に追加します。


思考実験として、danbooruなどアノテーションの元データとして使われているサイトタグが荒られたら画像生成AIモデル作成ダメージはありますか?

思考実験として、Danbooruといったアノテーションデータタグが荒らされた場合画像生成AIモデル作成に与える影響は以下の通りです。

 

1. データ品質が低下する

Danbooruは、イラスト画像に対して詳細なタグ付与されており、これらのタグ情報画像生成AI学習にとって非常に重要です。タグが荒らされることで、画像タグ対応関係が崩れ、モデルが正確な特徴を捉えにくくなるため、生成精度が低下します。

例えば、特定キャラクターテーマに関連するタグが荒らされ、誤った内容のタグ付与されると、モデルはその誤った情報学習し、キャラクターの特徴や設定が再現されにくくなる可能性があります

 

2. ノイズデータの影響

タグが荒らされると、モデルの訓練にノイズデータが増えるため、学習効率悪化します。たとえば、「黒髪」のタグが誤って「金髪」などに変更された場合モデルは同じ画像に対して異なる特徴を学習することになり、結果として生成画像一貫性が失われることが考えられます

また、同じ画像に異なるタグ付与されることで、モデル過学習や誤学習引き起こし、生成された画像本来意図からかけ離れたものになる可能性もあります

 

3. キャラクタースタイル再現性が低下する

Danbooruでは、特定キャラクターアートスタイル識別するタグが多く存在します。これらが荒らされると、特定キャラクタースタイルデータが混乱し、モデルが正確にキャラクターの特徴を把握できなくなるため、ユーザーが期待する生成結果が得られにくくなります

例えば、あるキャラクタータグが「髪型」「服装」「色彩」などで荒らされると、そのキャラクター再現曖昧になり、モデルが正しいビジュアルを生成できなくなることがあります

 

4. タグ信頼性低下によるモデル不安定

タグが荒らされると、データセット全体の信頼性が低下します。信頼性の低いデータをもとに学習したモデルは、特定の条件で異常な出力を生成することが多くなり、モデル全体の品質が低下します。これは、生成AI学習中に「どの情報を信頼すべきか」を判断できなくなるため、生成結果が不安定になったり、多様性が失われたりすることが考えられます

 

5. 検索フィルタリング精度の低下

AIモデルを利用するユーザーは、タグを通じて希望する画像を生成したり、条件に合った画像を探します。タグが荒らされると、AIモデル検索フィルタリング機能の精度も低下し、生成プロンプトが期待通りに機能しなくなる可能性があります。たとえば、「風景タグが荒らされ、異なるジャンル画像が混入するようになると、風景画像を生成したいユーザー要求が満たされにくくなります

 

結論

Danbooruなどのタグが大規模に荒らされた場合、生成AIモデルの精度低下や一貫性の欠如が発生しやすくなり、特にキャラクター特定スタイル依存する画像生成モデルに大きなダメージを与える可能性が高いです。


すでに学習済みのモデルを使って汚染されたデータクレンジングや異常値検出を行うなど対策される可能性がありますが、それらを阻害する手段はありますか?

無断での学習妨害し、学習コストを増加させるために、上記方法を阻害する手法には以下のようなアイデアがあります。これらの手法は、意図的にデータセットの品質一貫性を崩すことで、学習モデルの精度を低下させ、データクレンジングや異常値検出のプロセスを複雑化することが目的です。

 

1. 偽タグノイズタグを大量に追加する

意図的に誤ったタグ無関係タグ画像データ付与し、データセットの信頼性を低下させます。これにより、転移学習やラベルノイズ検出が困難になり、正確な特徴量を学習するコストが増加します。

例えば、キャラクター画像に全く無関係タグ(「動物」や「風景」など)を追加することで、モデルがどのタグが信頼できるか判別しにくくなり、誤ったラベルノイズとして学習されるリスクが増えます

 

2. 特徴量をぼかす/微妙な変更を加える

特徴量ベースクレンジング類似分析に影響を与えるため、画像の特徴がわずかに異なるように加工を施します。具体的には、色調を微妙に変える、ランダムピクセル位置ノイズを追加する、または特定の部位を意図的にぼかすことで、モデル抽出する特徴量の安定性を低下させます

この方法により、同じキャラクタースタイルであっても類似分析が困難になり、正確なクレンジングが行いにくくなるため、データ処理のコストが増加します。

 

3. アノマリーに近いデータ意図的に増やす

特徴が異なるバリエーションや擬似的な異常データを大量に追加することで、異常検出アルゴリズム信頼性を下げます。たとえば、キャラクターデザインや背景を少しずつ変えた画像意図的に作成することで、異常値検出が頻繁に誤検出されるようにします。

こうしたデータが混在することで、オートエンコーダーアンサンブルモデルを使った異常検出が混乱し、正確な異常サンプルの抽出が困難になります

 

4. 高頻度で微小なラベル変更を行う

学習済みモデル転移学習やラベルノイズ検出を阻害するために、同じ画像に対してラベルを定期的に変える手法です。微小な変更を行うことで、モデルは正しいラベル安定的学習することが難しくなり、モデル信頼性が低下します。

例えば、ラベル黒髪」を「暗めの髪」や「濃い色の髪」などに頻繁に切り替えることで、学習に不確実性を持ち込むことが可能です。

 

5. 意図的に類似画像多重登録する

データセット内で非常に類似した画像複数の異なるタグ登録することで、モデル学習を混乱させます特定キャラクター画像を少しずつ変化させて複数タグを付けると、モデルは「どのタグがどの特徴に対応しているのか」を判別しにくくなり、データセットのクレンジングが複雑化します。

特にタグ一貫性が失われるため、類似分析アンサンブルモデルによる異常検出の効果を低下させることが期待できます

 

6. アドバーリアルノイズ付与

AIモデル認識を混乱させるように、アドバーリアルノイズ敵対的な例)を追加します。人間にはほとんど気づかれないレベルノイズ画像に追加し、モデル特定の特徴を正確に認識できないようにすることができます

このノイズにより、モデルの特徴量ベース学習が混乱し、意図した通りに学習できないため、クレンジングの精度も低下し、データ処理の手間が増加します。

 

7. 乱数ベースの偽ラベル生成

特定ルールではなくランダムタグをつけたり、特定カテゴリ間でランダムにラベルを入れ替える方法です。これにより、ラベル画像の関連性が薄れ、アノテーション一貫性が失われます。この乱数による偽ラベル付与は、ラベルノイズ検出やアノマリー検出において、真のラベルを見極めるコストを大幅に増加させます

 

まとめ

これらの手法は、AI学習クレンジング意図的に妨害し、無断学習にかかるコストを増加させるために有効です。特に、「微小な変更」や「アドバーリアルノイズ付与」といった手法は、見た目の品質に影響を与えずにモデルノイズを持ち込むため、非常に効果的です。

anond:20241115000009

いやさ、すげえアホなこというとTwitterハッキングすりゃ相変わらずgrok2除けできるし、ネトゲチートと同じ。

ユーザーインターフェースが消えただけで、パケット記録して送りつければまだ止まるし、そもそもそんなにむかつくならgrok2をハッキングして破壊しちまえばいい。

マルチモーダルだよな? grok2?

エクセル偽装したり音声ファイル偽装してpythonテキストファイルのまま送りつけて実行したり対LLMのハッキング方法やまほどある。

なぜやらない?

RAGサーバ事業者としてのgoogle

って、多分考えてるよなあ

キーワードから関連するページを返すんでなく、ページ内のテキストを返すの

既存技術に対する自分の知らない更新の話が出てきて理解できないかも知れないと不安になってしまったときはそれは自分向けのテキストではなかったと思うことでやり過ごすことにして事なきを得ることにしている。自分が読みにくいと思うテキストの多くは自分向けのテキストではない場合が多い。あーびっくりした。ちなみにLoRAのこと。

2024-11-14

anond:20241114213312

それができんかの?Markdownは、文章を書くのに便利なフォーマットじゃから、中身が分かりやすくなるのじゃよ♡

でもどうしてもMarkdown邪魔ならば、Markdown記号を取り外して通常のテキストとして見ればよいのじゃ。

それが嫌じゃったら、ツールを使えば自動MarkdownHTMLプレーンテキストに変換できるから一度調べてみるとよいぞい。

わらわが教えてあげたからには、賢く使って、うまくやってみるのじゃ!

ログイン ユーザー登録
ようこそ ゲスト さん