生成AIにまつわる議論において、「無断学習」とは「生成AIの開発工程においてデータ提供者の許可を得ないままデータを利用する行為」のこと。
語呂がいいから「無断」と呼ばれるが意味的には「社会的合意の欠如」と表現する方が正しい。
社会的合意があればいちいち個別に許可を得る必要はない。たとえば画家が絵の練習として行う模写にはそれをしてもよいという社会的合意があるのでいちいち個別に許可を得る必要はない。
2018年の著作権法改正で生成AIの無断学習は合法化された。それまでは引用の要件を満たさない著作権侵害行為だった。
合法化されたにも関わらず悪印象のある用語「無断学習」が使われることは好ましくないという指摘が(生成AI推進派から)出ている。
データ提供者の許可を得ないままデータを利用するから「無断」なのであり、意味としては全く正しい。
代案を出さない生成AI推進派のせいではないかと思うのだが、適切な言い換え語がないため無断学習という言葉が使われ続けている。
声優やイラストレーターは生成AIを用いた脱法ビジネスや嫌がらせの被害者である。嫌がらせツールを開発するために自分のデータを提供したくないと考えるのは自然な流れである。しかしながら現行法ではデータ提供を拒否することができない。声優やイラストレーター、そして彼ら彼女らのファンは現状に強い不満を抱いている。ディープフェイク問題や肖像権侵害問題が新聞テレビで取り上げられたことからクリエイティブと縁のない庶民も不安を感じている。この不満・不安が無断学習という悪印象のある言葉を使い続ける動機になっている。
無断学習という言葉が使われ続けているのは、多分に代案を出さない生成AI推進派のせいである。生成AI推進派が適切な言い換え語を提案すべき。