2024-03-03

生成AI推進派が触れたがらない海賊版データ問題

文化庁AI著作権についてのパブコメの結果が話題ですね。自分も2万件超のコメントの一つです。副業程度の収入を得ているアマチュア絵描きとして、生成AIには何らかの規制必要であるという立場コメントを送りました。

主要な問題としてコメントに書いたのが、生成AI学習海賊版違法アップロードコンテンツ)が使われている問題です。


https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/hoseido/r05_07/pdf/94011401_01.pdf


文化庁PDFの30〜32ページに海賊版、つまり違法アップロードされた書籍写真動画、絵などをAI学習に用いることについての意見が並んでいます文化庁見解としては、生成AI事業者海賊版であると知ったうえでコンテンツ学習に用いた場合事業者権利侵害責任を問われる可能性があるとの考え方のようです。


現行の生成AI海賊版学習なんてしているのか? 確実にしているようです。画像生成AIひとつNovelAIが、海外無断転載の温床であるDanbooruから学習していると公言したりとか、MetaがAI学習使用したデータセットが膨大な海賊版書籍によるものだったとか、さまざまな話題があります

もとより、ウェブには権利者に無断でアップされたもの創作物だけでなく写真なども含む)が溢れかえっていることは周知の事実です。ウェブから効率よく膨大な学習データを求めれば、そうしたコンテンツが混ざってくることは当然なわけです。それを承知のうえで、生成AIの開発は行われている。

これはクリエイター企業著作権にとどまる問題ではありません。海外では、画像生成AI学習データ児童ポルノ個人プライバシーに関わる画像が含まれていることも指摘されています自分の知らないところで自分の写った写真ウェブに放流されAI学習対象になっている、ということもあるのです。


「たとえ海賊版個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。

ですが仮に、ある漫画家が「海賊版サイト漫画を読みまくって漫画勉強しました」と発言したら、とうぶん仕事を失うでしょう。違法行為であるかは別として社会的倫理的に許されない行為であることは明白だからです。

となれば、生成AI学習海賊版を用いることも同様に許されないでしょう(特にAI肯定立場から言われる「人間学習AI学習は同じ」という見方ならば)。

クリエイターが、海賊版学習したAIをそうと知って自身創作に使うことは、間接的な海賊版容認とも見なされるかもしれません。

倫理的学習方法によって成り立っているのが生成AIの現状です。批判的な立場からクリーン学習データによるAIが求められるのはこのような理由もあるわけです。


残念なことに、生成AI肯定・推進する立場の人々はこの学習データ問題に触れたがりません。自分の見てきた範囲ですが、本や記事SNSで、ここに真摯に向き合っている人はいません。

ディープフェイクや特定個人模倣などの悪質なAIの使い方だけが問題だ」という主張をし、その範囲では厳しく批判をする人はいます。もちろん悪質な使い方は許されません。しかし、自身の使っている生成AIがその学習の成り立ちから倫理的である可能性には触れません。認めると面倒なことになるのがわかっているからでしょう。

反発の声を都合よく切り取り、身勝手に新技術忌避している反AIというくくりで片付け、本来問題から目をそらしているのです。


生成AI開発者利用者も、まずこうした事実を認めて、横暴なやり方で莫大な学習データを確保し、その問題無視して利便性のみで強引に生成AIを普及させているという現状に向きあうべきです。

学習データ無作為な広範さが、ディープフェイクなどの悪事を容易にし広めていることも認めないといけない。そこから改めて、あるべき生成AIのあり方を考えないといけません。

許可を得たクリーン学習データのみを使用し、データ概要は開示すること、これが必要です。

AIの普及が避けられない、技術進歩は止まらない、と言うのなら、その過程で誰かを踏みつけにしない努力も払うべきです。生成AI批判する人の大半は、技術の発展に反対しているのではなくそ過程理不尽に反対しているのです。

  • お前もAI使って副業の稼ぎに追加すればいいのに・・・ AIで稼いでる人いっぱいいるで?別にサブ垢作ってそっちでAIやればいいんだぜ?

  • でもインターネットだってクリーンではないです 我々は海賊ではないにせよ、海賊から有形無形に物や事を受け取って産まれて育ってきて今ここに生きているのです

  • >「たとえ海賊版や個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。 >ですが仮に、ある漫画家が「海賊版サイトで漫画を読みまくって漫画を勉強しまし...

  • データの開示ねえ…… わざわざそんなことのためにサーバー建てなきゃならんのか 寄付も無いのにやってらんないよ どうして頭が足りん奴らはサーバーがタダだと思ってるんだ

  • 文化庁は「学習が合法だからと言って海賊版の違法転載が正当化されないように、力を入れて対処していきますね」と答えているんだが。 違法転載サイトで学習されることは確かに問題...

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん