「メタデータ」を含む日記

2024-11-15

■ChatGPTに画像の無断学習の対応策を聞いてみた

AIにAIへの対抗策を聞くってSFっぽくて楽しい。

ChatGPTは嘘もつくので、あくまで参考程度に。

・画像を生成するAIに対する対抗手段を教えてください。

画像を生成するAIによる無断学習や利用を防ぐために、以下のような対抗手段を講じることが可能です。
　
1.透かし（ウォーターマーク）の埋め込み:
画像に目に見えるまたは見えない透かしを入れることで、無断利用や生成AIの学習に対して抑止効果を期待できます。特に、目に見えない形で画像データに暗号的な透かしを埋め込む「デジタル透かし」技術が有効です。
　
2.メタデータの埋め込みとロボット排除設定:
画像データに著作権情報や「AIによる無断学習を禁止する」といったメタデータを埋め込み、ウェブサイトには robots.txt ファイルで画像クローラーのアクセスをブロックする設定を追加します。これにより、クローリングや収集の抑制が期待できます。
　
3.ステガノグラフィ技術の利用:
ステガノグラフィを用いて、画像に気づかれにくい形で識別情報を隠すこともできます。これにより、画像の流出経路や利用先を追跡でき、無断利用の発見に役立てることができます。
　
4.法的な警告表示や利用ポリシーの明示:
ウェブサイトや画像の配布先に、AIによる無断利用や学習を禁止する旨の法的警告や利用ポリシーを明示することも有効です。利用条件をはっきりと示すことで、AI 企業や研究者が慎重になる可能性が高まります。
　
5.画像認証技術の導入:
AIが利用しにくいように、画像に人間には気づきにくいパターンやノイズを挿入する技術もあります。たとえば、AIにはノイズとして認識されるが、人間には問題なく見える小さな変形やカラーパターンを追加することで、AIによるデータ学習が困難になる場合があります。
　
これらの対策は、画像生成AIに対する防御としては有効ですが、100%無断利用を防げるわけではありません

・生成AIの学習を混乱させる手段はありませんか？

生成AIの学習を混乱させるための手段には、以下のような方法が考えられます。
　
1.ノイズや歪みの追加:
画像に目立たない程度のノイズや歪みを加えることで、アノテーションモデルが境界や特徴を正確に認識しにくくする手法です。たとえば、ピクセルレベルでランダムなノイズを追加する、わずかに画像をぼかす、あるいは境界線付近に小さな変化を加えるといった手法が有効です。
　
2.不規則な輪郭の挿入:
アノテーション処理は、対象物の輪郭や特徴を正確に捉えることが重要です。そのため、背景や対象物の輪郭にわずかな不規則性を加えることで、アノテーションツールが対象物の境界を正確に判断しにくくすることができます。たとえば、背景に模様や偽の輪郭を挿入する方法です。
　
3.テキストやラベルを埋め込む:
画像に人間には視認しづらい形でテキストやラベルを埋め込むと、AIのアノテーションプロセスが混乱する場合があります。これにより、AIが意図しない領域を注視することがあり、誤認識を誘発します。
　
4.色や明るさのランダム変化:
画像の色や明るさを部分的に変化させ、一定のパターンを持たないようにすることもアノテーション処理の混乱を招く一手です。これは、オブジェクトの検出や認識が色や明暗の差異に依存している場合に有効です。
　
5.擬似的なオブジェクトの追加:
画像内に小さな擬似的なオブジェクトや模様を追加することで、AIがそれらを誤って主要なオブジェクトと認識し、アノテーション精度が低下する可能性があります。特に、背景に似たオブジェクトを散りばめることで、AIはどの部分が対象なのか判断しにくくなります。
　
6.アドバーサリアル技術の活用:
AIの認識を誤らせるために用いられる「アドバーサリアル（敵対的）な例」を使う方法もあります。特定のピクセルパターンや色の配列を配置することで、AIのアノテーションが意図的に誤作動するよう誘導できます。この技術は深層学習モデルに対して特に効果があります。
　
7.カモフラージュテクニック:
画像全体にわずかなカモフラージュパターンを重ねることで、AIの認識を混乱させる方法です。この手法では、人間が見た場合には問題なく認識できるものの、AIが対象を捉える際に誤って検出するようなパターンを画像に追加します。

・思考実験として、danbooruなどアノテーションの元データとして使われているサイトのタグが荒られたら画像生成AIのモデル作成にダメージはありますか？

思考実験として、Danbooruといったアノテーション元データのタグが荒らされた場合、画像生成AIのモデル作成に与える影響は以下の通りです。
　
1. データの品質が低下する
Danbooruは、イラストや画像に対して詳細なタグが付与されており、これらのタグ情報は画像生成AIの学習にとって非常に重要です。タグが荒らされることで、画像とタグの対応関係が崩れ、モデルが正確な特徴を捉えにくくなるため、生成精度が低下します。
例えば、特定のキャラクターやテーマに関連するタグが荒らされ、誤った内容のタグが付与されると、モデルはその誤った情報を学習し、キャラクターの特徴や設定が再現されにくくなる可能性があります。
　
2. ノイズデータの影響
タグが荒らされると、モデルの訓練にノイズデータが増えるため、学習効率が悪化します。たとえば、「黒髪」のタグが誤って「金髪」などに変更された場合、モデルは同じ画像に対して異なる特徴を学習することになり、結果として生成画像の一貫性が失われることが考えられます。
また、同じ画像に異なるタグが付与されることで、モデルが過学習や誤学習を引き起こし、生成された画像が本来の意図からかけ離れたものになる可能性もあります。
　
3. キャラクターやスタイルの再現性が低下する
Danbooruでは、特定のキャラクターやアートスタイルを識別するタグが多く存在します。これらが荒らされると、特定のキャラクターやスタイルのデータが混乱し、モデルが正確にキャラクターの特徴を把握できなくなるため、ユーザーが期待する生成結果が得られにくくなります。
例えば、あるキャラクターのタグが「髪型」「服装」「色彩」などで荒らされると、そのキャラクターの再現が曖昧になり、モデルが正しいビジュアルを生成できなくなることがあります。
　
4. タグの信頼性低下によるモデルの不安定化
タグが荒らされると、データセット全体の信頼性が低下します。信頼性の低いデータをもとに学習したモデルは、特定の条件で異常な出力を生成することが多くなり、モデル全体の品質が低下します。これは、生成AIが学習中に「どの情報を信頼すべきか」を判断できなくなるため、生成結果が不安定になったり、多様性が失われたりすることが考えられます。
　
5. 検索やフィルタリング精度の低下
AI モデルを利用するユーザーは、タグを通じて希望する画像を生成したり、条件に合った画像を探します。タグが荒らされると、AI モデルの検索・フィルタリング機能の精度も低下し、生成プロンプトが期待通りに機能しなくなる可能性があります。たとえば、「風景」タグが荒らされ、異なるジャンルの画像が混入するようになると、風景画像を生成したいユーザーの要求が満たされにくくなります。
　
結論
Danbooruなどのタグが大規模に荒らされた場合、生成AI モデルの精度低下や一貫性の欠如が発生しやすくなり、特にキャラクターや特定のスタイルに依存する画像生成モデルに大きなダメージを与える可能性が高いです。

すでに学習済みのモデルを使って汚染されたデータのクレンジングや異常値検出を行うなど対策される可能性がありますが、それらを阻害する手段はありますか？

無断での学習を妨害し、学習コストを増加させるために、上記の方法を阻害する手法には以下のようなアイデアがあります。これらの手法は、意図的にデータセットの品質や一貫性を崩すことで、学習モデルの精度を低下させ、データクレンジングや異常値検出のプロセスを複雑化することが目的です。
　
1. 偽タグやノイズタグを大量に追加する
意図的に誤ったタグや無関係なタグを画像データに付与し、データセットの信頼性を低下させます。これにより、転移学習やラベルノイズ検出が困難になり、正確な特徴量を学習するコストが増加します。
例えば、キャラクター画像に全く無関係なタグ（「動物」や「風景」など）を追加することで、モデルがどのタグが信頼できるか判別しにくくなり、誤ったラベルがノイズとして学習されるリスクが増えます。
　
2. 特徴量をぼかす／微妙な変更を加える
特徴量ベースのクレンジングや類似度分析に影響を与えるため、画像の特徴がわずかに異なるように加工を施します。具体的には、色調を微妙に変える、ランダムなピクセルの位置でノイズを追加する、または特定の部位を意図的にぼかすことで、モデルが抽出する特徴量の安定性を低下させます。
この方法により、同じキャラクターやスタイルであっても類似度分析が困難になり、正確なクレンジングが行いにくくなるため、データ処理のコストが増加します。
　
3. アノマリーに近いデータを意図的に増やす
特徴が異なるバリエーションや擬似的な異常データを大量に追加することで、異常検出アルゴリズムの信頼性を下げます。たとえば、キャラクターのデザインや背景を少しずつ変えた画像を意図的に作成することで、異常値検出が頻繁に誤検出されるようにします。
こうしたデータが混在することで、オートエンコーダーやアンサンブルモデルを使った異常検出が混乱し、正確な異常サンプルの抽出が困難になります。
　
4. 高頻度で微小なラベル変更を行う
学習済みモデルの転移学習やラベルノイズ検出を阻害するために、同じ画像に対してラベルを定期的に変える手法です。微小な変更を行うことで、モデルは正しいラベルを安定的に学習することが難しくなり、モデルの信頼性が低下します。
例えば、ラベル「黒髪」を「暗めの髪」や「濃い色の髪」などに頻繁に切り替えることで、学習に不確実性を持ち込むことが可能です。
　
5. 意図的に類似画像を多重登録する
データセット内で非常に類似した画像を複数の異なるタグで登録することで、モデルの学習を混乱させます。特定のキャラクター画像を少しずつ変化させて複数のタグを付けると、モデルは「どのタグがどの特徴に対応しているのか」を判別しにくくなり、データセットのクレンジングが複雑化します。
特に、タグの一貫性が失われるため、類似度分析やアンサンブルモデルによる異常検出の効果を低下させることが期待できます。
　
6. アドバーサリアルノイズの付与
AI モデルが認識を混乱させるように、アドバーサリアルノイズ（敵対的な例）を追加します。人間にはほとんど気づかれないレベルのノイズを画像に追加し、モデルが特定の特徴を正確に認識できないようにすることができます。
このノイズにより、モデルの特徴量ベースの学習が混乱し、意図した通りに学習できないため、クレンジングの精度も低下し、データ処理の手間が増加します。
　
7. 乱数ベースの偽ラベル生成
特定のルールではなくランダムにタグをつけたり、特定のカテゴリ間でランダムにラベルを入れ替える方法です。これにより、ラベルと画像の関連性が薄れ、アノテーションの一貫性が失われます。この乱数による偽ラベルの付与は、ラベルノイズ検出やアノマリー検出において、真のラベルを見極めるコストを大幅に増加させます。
　
まとめ
これらの手法は、AIの学習やクレンジングを意図的に妨害し、無断学習にかかるコストを増加させるために有効です。特に、「微小な変更」や「アドバーサリアルノイズの付与」といった手法は、見た目の品質に影響を与えずにモデルにノイズを持ち込むため、非常に効果的です。

Permalink | 記事への反応(1) | 17:00

■anond:20241115131222

あるよクオリティ高く見えてもAI絵なら価値ない

価値の定義がそもそも作品を楽しむ人間として歪んでるってことだね。

いや、作品の価値の話をしてないが正しいのか。

作者やその周辺情報も含めたメタデータとコンテンツの価値を含めたものを「価値」と名付けて一般的な価値と差別しないからずれるんだと思う。

価値の評価軸が画一的というか...。これって問題の根っことしては撮り鉄の話と近いように見えて面白いな。

世間一般が全く価値を見出せない鉄道写真に価値を見出す撮り鉄とそれ以外の対立と同じことが起きてるねこれ。

Permalink | 記事への反応(1) | 13:22

2024-10-12

■anond:20241012041038

あっぷでーと:

単位:千円で決算を出している決算書に対応。

要約財政状態計算書しか公開していない困ったちゃんに対応。

とりあえず、資産の部の6割を流動資産とみなすことにした。

そして、今のところ対応できないのが、決算短信の財務諸表を画像データで添付している場合。

画像で添付するとか、なんでそんなことするのさ・・・

pytesseractとかを試してみたけど、OCRの精度低すぎて使えない。

と、いうか、貸借対照表や損益計算書ぐらいpdfではなくて、共通フォーマットのメタデータと整備してほしいわ。

Permalink | 記事への反応(0) | 17:19

2024-10-02

■anond:20241002172759

Youtubeとかニコニコから著作物の利用料取らない怠慢なのが悪いだけですよね

動画に紐づけてプレイしてるタイトルのメタデータも記録してるのに金取らない権利者がアホなだけ

Permalink | 記事への反応(0) | 17:29

2024-09-14

■anond:20240914094639

図書館司書に求められてるというより図書館に求められてる仕事よね。原本は札幌、仙台、新潟、東京、名古屋、大阪、松山、広島、福岡、沖縄各一箇所くらいに集約して、そこで全部電子化して体系的に整理して全国どこからでも閲覧できる形にしてほしいよね。歴史研究が加速度的に進むと思うよ。田舎の図書館の検索マシーンとしての司書より遥かに重要な仕事よ。そのメタデータ全部食わせたAIに勝てる人間の司書なんか出てこないよ。

Permalink | 記事への反応(1) | 12:22

2024-03-21

■LINEよりSignalを使うべき理由

LINEやWhatsApp、SignalはどれもE2E暗号化を採用している。

しかし、Signalの方がLINEやWhatsAppよりも安全である。

まず、データ送信時に、メタデータも送信している。

メッセージの内容はエンドツーエンド暗号化によって保護されるが、LINEはメタデータを保護しない。

つまり第三者がその情報を知ることができる。

一方、Signalはメタデータを保護している。

メッセージとメタデータに加え、アプリはスマホに保管されている情報も収集できる。

LINEは、LINEの海外拠点が、開発・運営業務上の必要性からデータにアクセスできる状態になっていたことについてユーザーへの説明不足が指摘されている。

一方、Signalは電話番号のみを必要とする。その電話番号も、身元に関連づけることはない。

どの企業がメッセージングサービスを所有しているかも重要である。

新生Zホールディングスは、LINEをグループに加えたことで、ヤフーやその他のサービスとの業務連携を強化するとしている。これは個人情報の流用を示唆する。

一方、SignalはSignal Technology Foundation社が所有している。ユーザーの寄付で運営される登記された非営利団体であるため、LINEよりはマシだろう。

LINEとSignalでは、安全なメッセージングアプリを選ぶならSignalが断然良い。

Permalink | 記事への反応(0) | 22:52

2024-03-12

■だいたいC2PAで対処かな

画像に関して言うなら、C2PAと言う、画像の来歴、改変の有無などを記録する規格ができつつあって、それで対処すると言うことのようだよ。

企業がやってる生成系AIで作られたものには、AIで作った事がわかるデータを埋め込む
- https://pc.watch.impress.co.jp/docs/news/1567078.html
撮影した画像がリアルで撮影したことを証明するために、写真に電子署名をつける
- https://c2pa.org/
- https://www.watch.impress.co.jp/docs/news/1567571.html

ほかにもIPTCというものもある。（これは元々の目的はちょっと違うか）

で、主要カメラメーカーは参画してるし、スマホだとGoogleが参画しているので、Androidではデフォでメタデータがつくようになるよね。

では、野良 AIでつくられたやつはどうするかというと、AIで作られたかどうかを見破るAIというやつがあって、それなりの精度が出せてる。

インスタとかでAI生成画像をアップするとラベルがつくようになるらしい。

https://www.itmedia.co.jp/news/articles/2402/07/news087.html

anond:20240311183549

Permalink | 記事への反応(0) | 10:09

2024-01-25

■anond:20240125170027

20年前の今頃は、配信のやつはいつ消えるかわからんって言ってたしその通りだったし、何より回線に負担かけるのコストだったけど、今のサブスクからブツが消えるなんてほぼないと思うんだよな。

なんなら20年前ごろのデータ、音質悪いメタデータついてない癖に容量ばっかとって邪魔だから、もういらん。

……と思うんだがどうかな。やはり合理的意味以上に所有したい気持ちが勝るだろうか。

Permalink | 記事への反応(1) | 17:12

2023-12-09

■anond:20231209060413

SEOなんてWebで金稼ぎたいモンスターしかやらんわ

てかSEO 対策って言葉なんか当たり前になっちゃってるけどおかしくね

SEO 自体が(Webにアップロードするhtml等の記述を)サーチエンジン最適化(することで表示ランク上げる)って意味で、SEOで完結してるんだから

最適化対策をするとしたらGoogleとかのエンジニアがやることじゃん

対策って単語を入れるなら、SE 対策、になるはずじゃね

だいたいそんなもんに頼らなくてもね、自力で目的のページにたどり着ける知能がないと人間の情報リテラシーが最適化されていかないのよ

現に今あんたの経験値は1上がっただろ

そうやって全員が経験値稼いで実力をつけていくことのほうが大事なんだよ

なんでもかんでも相手がお誂え向きにデータを整え分類してくれてあると思っちゃダメ

インターネットってのは混沌としてて当然であるべきなの

秩序立てて分類することで利益を得ようとするエンジン側勢力にアップロード側が寄り添って、メタデータを充実させてやるのも悪いお節介ではないが

そういう自発的なお節介に依存してちゃダメなんだよ、現に利益を得ようって人しか熱心にやらないだろ、足並み揃えようがない

究極的には分類する側がひたすらマッチョに賢くなっていくしかないし、それによってSEOなんてものは不要になっていくべき

Permalink | 記事への反応(2) | 06:23

2023-12-05

■anond:20231205103520

認識がズレてる。「メタ」とはある事象の上位概念のことだと思ってる。

「メタ認知=認知に対する認知」「メタデータ=データに対するデータ」といった具合。

元々対策するなんて意味なんかないはずなのに

ゲームシステムや個々のゲームプレイだけではなく、そこにいるプレイヤーたちの傾向を考えて対策するのが「メタ」なの。

というのは「メタ」の使い方がおかしいと思う。

Permalink | 記事への反応(2) | 12:44

2023-11-07

■

https://vaaaaaanquish.hatenablog.com/entry/2023/11/07/180723

Python パッケージにおいては正確なメタデータがPyPI API から返ってこない

これずーっとそうだよね

公式のコメントは負荷がどうとかいうことになってるけど、前日分まではバッチで生成してCDNに、当日分だけサーバーで生成するとか如何様にも対策できるだろ

実際にはやりたくない事情があってやってないだけで

Permalink | 記事への反応(0) | 22:05

2023-08-23

■WEB 画像の解像度は72dpiに設定すべきという幻想は捨てろ

Twitterで映像畑の人による「映像系に使用する画像で72dpi以上は必要がなく、事前に整理するのが当然なんだけど350dpiのままで作業する人がいた。基本が抜けてるなぁ」といったツイートを偶然目にしてしまい、以下これに関してつらつらと書いていく。

結論から書くと、WEB 画像の解像度設定は72dpiだろうが350dpiだろうがなんでもよく、縦と横のピクセル数だけ見ていればよい。

＜DPIとは？＞

「印刷用解像度設定」といったメタデータと考えてもらって構わない。

簡単に説明すると、DPIとは、その画像をどれだけのキレイさで印刷するかという品質設定の単位である。

dot per inchの略であり、1インチにどれだけドットを敷き詰めるかをこの数値で設定する。

72dpiは1インチあたりに72ドット、350dpiは1インチあたり350ドット。ドットの数が多いほど密度が上がるので鮮明に見える。

要はパソコンのディスプレイ解像度と同じ。同じピクセル数の画像を72dpiの設定で印刷しようとすると大きく荒く出て、350dpiの設定で印刷すると小さくキレイに出る。

FHDの動画を27インチFHDモニターに等倍で再生すると全画面で再生されるが、27インチ 4K モニターの場合、画質は良いが拡大しないと小さいウインドウ内で再生されるイメージとおおよその構造は一緒。

一般に印刷用の画像データは350dpiにするのが理想とされている。

そのデータを映像制作に使用する際に、解像度設定をそのままにしている人に対する嘆きが冒頭のツイートにつながったのだろう。

＜WEB 画像におけるDPI（PPI）＞

DPIとは「印刷用解像度設定」のことなので、デジタルで表示・使用する場合、この数値は関係がない。

というか、そもそもソフト側で参照されている様子がない。

つまり DPIはどうでもよいのだ。

重要なのはピクセル数だ。1920×1080pxの画像があったとする。

解像度の設定を350から72dpiに変更したとする。

デジタル上でなにが変わるか。

なにも変わらないのである。

画像の見た目も、容量も変わらない。カンバスサイズも変わらない。

実際に解像度の数値を変更した画像をブラウザで読み込んでみたところ、表示されるものは全て一様であった。

つまり全く変わらないのである。

なお、Photoshop上で解像度の数値を変更する際、設定によっては解像度の数値の増減に合わせて縦横のピクセル数も増えたり減ったり（拡大縮小）するので、それによって画像のサイズが変わりはする。

ただそれはピクセル数の増減によってサイズが増減するということなので、例えば350dpiを72dpiにしたから画像が小さくなった、とは言えない。

ちなみにディスプレイ上ではDPIではなくPPIと呼ぶ。なぜならばDotではなくPixelだから。どうでもいい話ではあるが。

＜そもそもディスプレイの解像度は＞

72ppiじゃないよね。iPadは264ppi、iPhoneは460ppi のものもあるよね。

「モニターは、72ppi！」というのはあまりにいにしえの知識と言える。

さらに言うと、ppiは画面解像度と画面の物理的なサイズによって算出される。だって per inchだもん。

例えば4k モニターでも31 インチなら142ppi。20 インチなら220 ppiだ。同じ数ピクセルが詰まってるなら画面が小さい方が細かいでしょ。

というか、逆に言えば80インチの場合 4Kと言ったって55ppi である。フルHDは28ppiだ。

ね、ppiのことを考えるのがどれだけ無駄か分かるでしょ。

＜映像制作においては＞

最終的にエンコードする画面解像度、つまりフルHDなのか4Kなのかなどによって必要な素材のピクセル数は決まってくる。

だからデカすぎる画像はリサイズせよというのは分かる。

しかしそこにdpiだのppiだのといった数値はもはや関係がない。ピクセル数を削れという話なのだから。

したがって、繰り返しになるがピクセル数だけ見ていればよい。

映像制作中においても、素材画像の解像度設定が350だろうが72だろうが、画質になんの違いも出ない。

制作後も最終的にはエンコードをするので元素材画像の解像度設定はガチのマジで関係がない。

素材データの受け渡しを考えても画像容量も変わらないので本当に意味がない。

つまり、WEB 画像の解像度設定は350dpiだろうが72dpiだろうがなんでもよく、縦と横のピクセル数だけ見ていればよい。

そして解像度設定の数値は画像の素性に一切の影響を与えない。

※画像の解像度設定の数値がバラバラだと先方にナメられるから、とかはガチで知らん。しょーもないと思う。

なんというか、基本を知らないなあと言っている側が昔の作法からアップデートできていないだけでしたっていうのを見て色々と考えてしまったものである。

（もしなにか「いや違う！」といった指摘があったらください。）

以下余談---------

＜※IllustratorやPhotoshopなどにおいては＞

これらのソフトの場合、解像度設定の異なる同じ画像をドキュメント内に配置した場合、配置された画像の大きさ（縦横サイズ）に違いが出る。

なぜならばこれらは印刷を前提としたソフトであり、また、ドキュメント自体に印刷解像度の設定がなされているからである。

＜個人のこだわりの場合＞

なんとなくWEB 画像の場合は72にしないと気持ちが悪い、といった場合は否定しないが、それはあくまで個人のこだわりなのでそうしない人を基本が抜けてるとかう〜んとか言うのはやめた方がいいと思いました。

（イラレ上で画像を拡大縮小してるのに元画像の解像度を350dpiにするのにこだわるような意味のなさ。拡大縮小してる時点で解像度は変わってるし、印刷所でRIPのときに均されるんだからさ※後述）

＜デジタルはわかった。結局印刷の場合ってどうすればいいの？＞

A4／350dpiに必要なピクセル数が約W2890H4090pxなのでそれくらいで良いのでは。

ちなみになぜ350dpiが良いとされているかというと、これ以上解像度を増やしても人間の目にはあまり区別がつかないとされていたり、印刷機の性能の事情などによってそうなっている。

ポスターなどは150〜200dpi程度あれば十分とされる。デカいものは近くで見ないし多少荒くて良いのだ。

抱き枕やタペストリーなどもそれくらい。近くで見るものだけど、布自体の目が粗いのでデータの解像度を上げてもあまり意味がない。滲むし。

（布の種類にはよるが……）

ポスターも先述の通り解像度自体落とすので相対的にピクセル数は変わらずA1／150dpiの場合約W3500H4960pxなので上記より少し増える程度。

抱き枕カバーのようにすごく縦長とかでもない限りざっくり縦横5000pxあればもう十分なのではと思う。

というか、素人の場合は印刷の場合もピクセル数だけ見ていれば良いと思う。

実際に印刷されるデータは印刷所でRIP（リップ／リッピング）といって、印刷用データに変換されるんだけど、そのときに印刷解像度はあらかじめ印刷所で設定された数値に変換されることがほとんどだろう。

だって必要な印刷解像度って印刷機の線数の2倍って言うし。ほらまた知らない単語が出てきた。入稿先の印刷機の線数なんて把握せずに解像度設定してるでしょ。普通は175lpiなんだって。LPI。Line per inchね。その2倍。だから350なんだね。知らないでしょ。だからいいんだよ。良きようにやってくれるんだから。

A4なのかB5なのかとにかく出力サイズがわかっていて、それに十分なピクセル数が足りていれば良い。あと塗り足しね。

変に知識をつけて画像解像度350dpiにしました！仕上がりサイズはA4です！っていって縦横350pxみたいな画像が配置してあるデータ送られてきてもガビガビに印刷されるだけだよ。大事なのはピクセル数。覚えてこ。

Permalink | 記事への反応(1) | 01:06

2023-05-09

■

https://inside.pixiv.blog/2023/05/09/183635

白状すると、数日前にBot動かしてた（メタデータ収集目的であり画像収集目的ではない）けど、別に何にも引っ掛からなかったので、Bot Protectionもたかが知れてる感じはある

画像以外にはProtection掛けてない可能性もあるかもだが

Permalink | 記事への反応(0) | 21:21

2023-05-08

■AI 学習 否定派絵師はちゃんとAI 学習 対策しているのか

AI 学習否定派の神絵師様の証言が集まっていたので、ちゃんとAI 学習対策してるのか調べてみた。

https://www.itmedia.co.jp/news/articles/2305/08/news068.html

名前（敬称略）	フォロワー数	Pixiv	Twitter	danbooru
あかもく	24万	非公開	公開中	takedown済
イコモチ	64万	非公開	公開中	takedown済
皐月恵	13万	非公開	公開中	転載済(58件)
黒須	10万	非公開	公開中	転載済(218件)
霧月	25万	一部非公開	公開中	転載済(189件)

転載サイトまで対策しているのは5人中たったの2人しかいなかった。

件数を記載しているように、転載サイトには作者タグがあるのでほんの数分で神絵師が投稿して転載された作品数まで知ることができる。

そしてイラストのメタデータはやたら充実している(anond:20230507074525)ので転載サイトで学習してしまえば悪意のある絵柄模倣はpixivだけ非公開にしようがハナクソほじるように簡単に実行できるだろう。

そもそも Twitterでもイラストを大公開しているので、アカウントと関連付けて学習するだけでもPixiv公開と似たようなAI 学習効果はあるだろう。今すぐTwitterのイラストを消すべきでは？

流言に流されてなんとなくの対策をしてる人が多く、半端で非常に残念としかいいようがない。

転載の対策をしない限りTwitterにイラストアップしてる時点でPixivを非公開にしようが関係なく転載され続ける。Twitterだけでも学習できるけど。

ちなみに転載は海外サイトで行われてるので最強の盾「フェアユース」が壁になってるから開き直られたら対策不能。danbooruはクリエイターの依頼で非公開対応してくれるので比較的優しいサイトではある。

今のフォロワー数で十分に仕事が来て、絵柄の模倣が損になる神絵師はこういった非公開対応をする価値があるが、

フォロワー増やすべく活動しないといけないTier2のイラストレーターたちは転載やAI 模倣に嫌な思いをしつつも

Twitterで活動し続けないといけない地獄の環境といっていいだろう。

Permalink | 記事への反応(2) | 13:53

2023-05-07

■anond:20230507133327

いわゆる国産 P2P ソフトと違ってBitTorrentはあくまでも通信プロトコルでしかないので…

歯抜けが多すぎる。

国産 P2Pも大差がない(古いファイル・人気がないファイルでは歯抜けが普通に起こる)

検索機能がない。

ピア間でメタデータをやり取りして検索できるような実装になっているBT クライアント(BitCometなど)もある。

トラッカーサイトが乱立して不便。

RSSでいーじゃん

アップロード絞りをするフリーライダー対策がない。

会員制トラッカーサイトでは共有比による監視が行われていてフリーライダーはダウンロードできなくなるし、最悪サイトから蹴り出されるよ。

Permalink | 記事への反応(0) | 15:38

■Pixivに投稿するとAI絵に学習されるというデマ

アンチ AIの人はAI使ったことないからよく分かってないみたいだけど、

Pixiv 自体はAIにとって話にならないんだよね。学習の参考にならないから。

Pixivの次にヤバいのがTwitterなんだけど、まさかアンチ AIなのにTwitterにイラストアップしてるマヌケだったりしないよな？

https://b.hatena.ne.jp/entry/s/twitter.com/tadanojako/status/1654676274089197568

AIが学習する上で一番重要なのはメタデータの質なので、最近の2次元 AIは黙って転載サイト danbooruとか使ってるよ？

danbooruの転載元として多いのはPixivとTwitterなのでPixiv云々は致命的に間違ってるわけでもないのだが。

本気でアンチ AIならTwitterに一切のイラストを投稿しないで活動しないといけないので、

人々に見て貰いフォロワーを増やすことで仕事に繋げるイラストレーターとしては自殺でしか無いと思うけど、思想信条の問題なら仕方ないかな。

転載サイトのトップで見かけたピーチ姫だが、投稿されたPixivと転載先のdanbooruのメタデータの差は圧倒的でどちらから学習したほうが精度が高くなりそうかはバカでも理解しやすいだろう。

https://www.pixiv.net/artworks/107888278
https://danbooru.donmai.us/posts/6286948

Pixiv

#スーパーマリオ #ピーチ姫

danbooru

#mario (series)

#super mario odyssey

#princess peach

#1girl

#blonde hair

#blue eyes

#breasts

#day

#earrings

#from above

#hat

#high heels

#jewelry

#large breasts

#lips

#long hair

#long skirt

#looking at viewer

#open mouth

#outdoors

#pink lips

#pink skirt

#shirt

#skirt

#smile

#solo

#sun hat

#white headwear

#white shirt

pixivに転載サイトなんとかしてくれという要望なら理解できるのだが、Pixivを悪者にしたら回避できると頭の悪い学習をしてしまっているようだ。

Pixivは規約上スクレイピング禁止でも転載され放題な現状なので。

よくわからない第三のイラスト投稿サイト（）とやらがスクレイピング禁止してもイラストが集まるなら転載サイトは無視してくるよ。

Permalink | 記事への反応(2) | 07:45

2023-04-25

■

本格なAI アイドル、中の人のいないVTuber（AITuber）が出てくると、それは空っぽの抜け殻なのか、本質なのか。

ウマ娘のような擬人化コンテンツにせよ、VTuberにせよ、近年の特徴は「メタ」、情報やナラティブの付加や、一歩俯瞰した外側から眺めることで、情報量の増加と奥行きを楽しむものだったように思える。

AITuberはメタを取り払った中身だけの存在か、メタデータそのもの、人間性の皮膜を俯瞰して楽しむものなのか。

Permalink | 記事への反応(0) | 12:53

2023-04-08

■anond:20230405152609

SSDのデータ復元も試してみた？

SDカードにはメタデータくらいしか残ってなくてもSSDの容量次第では上書きされてないかもよ

Permalink | 記事への反応(0) | 09:31

2023-04-01

■

anond aiで作成に汚染されて憤慨する増田の画像。<タグ> <meta メタデータ> <meta メタデータ> <meta メタデータ> <meta メタデータ> <meta メタデータ> <meta メタデータ> <meta メタデータ> <meta メタデータ> <メタデータ> <メタデータ> <meta メタデータ> <meta メタデータ> <meta メタデータ> <meta メタデータ> <

Anond AIで作成

Permalink | 記事への反応(0) | 08:33

2023-02-26

■画像生成AIの適正使用及びそれに伴う著作権 制度(略)の提言の提言

画像生成AIの適正使用及びそれに伴う著作権制度の整備に関する提言（第1版） | クリエイターとAIの未来を考える会

https://support-creators.com/archives/34

＞①

＞法解釈の議論の成熟を待つことなく、画像生成AIの機械学習における著作物の使用は適法であるという考え方が一方的に広まり、上述①の問題は、事実上野放しとなっている。

野放しになっているなら議論を深めればいいのでは？

＞最近では、公開された学習済みAI モデルを利用し、特定の創作者の制作物の特徴を模したアダルト画像を販売して収益を得る者が出ており、本来の創作者は、対価を受けることなく著作物を無断で使用されただけでなく、その技術が盗用及び悪用されている。

「著作権者の利益を不当に害する場合はこの限りではない」の但し書きで殴れば(訴えれば)いいじゃん。

議論したり訴えたりするのは面倒くさい(もしくは、議論をする”面倒な人”と思われたくない)のが大きいんだろうな。

＞②

＞該当のAI 画像生成時のメタデータ及び生成過程の情報を削除することによって立証は困難となる

メタデータがあろうが無かろうが、最終成果物が違法なら違法だし、合法なら合法。

AI叩く人でよく勘違いしてるけど「AIと言い張れば合法になる」は明確に間違いで、

その画像が元の画像の権利を侵害していれば、それがAIで作ろうが人間が頑張って絵柄を勉強して描こうが違法である事は変わらない。

＞提言3

＞著作権は、これまで通り、思想または感情の創作的表現に与えること。

この著作権に関する話ってどこから出てきたんだ？

改正著作権法でも「AIは思想または感情の創作的表現が無くても著作権を認める」なんて話は無いし

日本の著作権は昔も今も「思想または感情の創作的表現」が対象でAIは何も関係無い。

Permalink | 記事への反応(1) | 05:01

2023-02-09

■anond:20230208202950

EXID（イーエックスアイディー、朝: 이엑스아이디）は、韓国のガールズグループである。2012年デビュー。グループ名は「EXCEED IN DREAMING (夢を越える)」から来ている。前事務所との契約満了に伴い2019年以来休止状態となっていたが、2022年に10周年記念シングル"X"をリリースしグループ活動の継続を示した。日本での活動は2022年のファイナルツアーをもって終了したとしている。

エキシディ(Exidy)は、1974年から少なくとも1986年（Chillerがリリースされた年）のビデオゲームの初期に存在した、アーケードゲーム最大手の企業のひとつである。

Exchangeable image file format（エクスチェンジャブル・イメージ・ファイル・フォーマット）は、富士フイルムが開発し、当時の日本電子工業振興協会 (JEIDA)で規格化された、写真用のメタデータを含む画像ファイルフォーマット。デジタルカメラの画像の保存に使われる。略称はExifで「エグジフ」（もしくは「イグジフ」）。