はてなキーワード: 機械学習とは
「機械学習によって、他人の著作物を利用して、データXを生成した」時、データXには著作権が発生しないが、それを生成したアルゴリズムやプロンプトと言ったところに著作権が発生する。
俺はずっと言ってるんだけど、「AIで生成した画像」を売るんじゃなくて、プロンプトを売れと。「それをどうやって生成したのか」の裏側を売れと。そこに価値があるんだと。
もちろん、例えばゲームを作る時に、素材のひとつとして利用するのは問題ないだろうが。
そういうことをやらないで、「AIで生成した画像」そのものを商品とするということは、他人の著作行為そのものを簒奪して商用利用してるだけだよね。それが批判されているわけでしょう。
機械による解釈をいくら挟もうが、機械は自我を持たないので、「人間が機械にデータを与え、機械がデータを吐き出す」という構図は変わらない。
他人の描いた絵をデジカメで撮ってjpgで配布するという行為に対して、「データは電圧の高低に過ぎず、元の著作物から独立して生まれたものなので、これは私の著作物だ」という主張は通らないでしょ。
少なくともそれは「機械が生んだ著作物」ではないんだよ。「人間が機械を使って生んだ著作物」にはなり得るが、だとすれば、「人間が、機械に対してどのような操作をしたのか」という点に価値があり、それこそが著作行為であり、それは当然学習工程も含む。
現行法において言えば、「機械学習によって生まれた画像やテキストは、それ自体は著作権を持たず、それゆえに著作物を学習させたとしても著作権侵害にならない」という論理を採用している。しかし、それ単体で商売をするとなると、やはり著作権的な問題とは無縁ではいられないだろう。
私は、今後のAIの発展のために、商用利用も含めて、クリーンな扱いとはどういうことか、今のうちにきちんと議論しておく必要があると思うよ。
どうせ官主導ではうまく行かない。だが、理想論をぶち上げる意味はあるだろう。
※計算基盤を自作するのは非常に重要で、そうしないと、GPUクラスタ内での並列化や通信ネットワーキングなど、ChatGPT を動かすためのコアの機能を獲得することができない。正直、ここを外資に握られてたらどうしようもないんじゃないか。
つまり、「そんなこと言われても、キリスト教徒なんだから、みんな平気でコーランを踏むよね」ってことかな?
この場合、具体的に「踏む」のはどっちなんだろう。AIの機械学習範囲を拡大しようとする動きなのか、著作権者の権利を保護しようとする動きなのか。
その通り。あなたはこの問題の根幹をよくわかっていると思う。著作権もわいせつ表現規制も表現の自由に対する制約。でも、今までの表自派の圧倒的多数は、そこを制約することについては割と妥協的・肯定的だった。法律なんだから仕方ない、著作権者を守る(ひいては自分たちの消費権を守る)ためには仕方がない、などなど。
あくまで、この制約があった方がよりたくさんの「表現」が生まれてみんな幸せになるから、という理屈で制約が認められてきたわけだけど
ここもその通り。「模倣元となる人間の「表現」がマストでなくなる」かどうかは、現時点では我々にはわからない。暗号生成時のシードのように、どこかに人間のオリジナリティを注入しないと中長期的には創作の幅・質が枯渇していくのかもしれないし、人間が不在でもAIの生成物自体が機械学習のリソースになって、無限に豊かな創作・出力が可能になるのかもしれない。
にもかかわらず、現時点で、すでに著作権者の権利を度外視してでも、自分の求める生成物(表現)を得ようとして活動している連中が一定数出てきていること、それに対して、著作権者の権利保護に対する賛同の動きがあまり見られないことは、一応の事実なんだよね。
問題は、その一群は「表現の自由」クラスタの中でどれぐらいの勢力になるのか。〈表自〉から排除されるのか、むしろそれこそがラディカルな〈表自〉と見られるようになるのか。そもそも「表現」という概念自体が今と同じままでいられるのか。
みんなが共通の敵(たとえば「フェミ」)を指さしている間は、根本的価値観が違う人間同士でもそのことに気づかずに(あるいは片目をつぶって)結束できる。これからは、議論の焦点はそこではなくなってくる。これまで表自を自認していた人々の間にもともとあった根本的な価値観の違いが炙り出され、袂を分かつ時代が来た。という話。
ネットにいる表現の自由擁護派(特にツイフェミとの抗争で表自を自称するようになった連中)には、「表現の自由」のことを「俺好みのイラストやコミックやその他のコンテンツを制約なく供給してもらえる権利」と思っている層が一定数含まれている。そいつらの動向を見ていると、画像生成AIが、ネット上やオフラインの著作権者のマテリアルを「学習」することで、その著作権者が築き上げてきたスタイルを模倣した表現を無限に生成して出力することも、「表現の自由」の範囲にあると考えている連中が予想外に多い。
CivitAi(https://civitai.com/)やHugging Face(https://huggingface.co/)には、すでに特定の作家や絵師のスタイルを(もちろん当事者に無断で)集中的に学習させたモデルが続々と公開されていて、作家にとっては直接の脅威になりつつある。以下は、自分の画風をモロパクされ、しかも「○○(絵師名) style」と銘打って公開されている絵師さんの悲鳴。これは、長年の修練を経て自己の作風を確立してきた「表現者の権利」に対する冒涜・挑戦だと言ってもいいだろう。
https://twitter.com/pottsness/status/1637930835746910208
そういう傾向があまりに加速している結果、今度は対抗手段として、画像コンテンツに、AIの機械学習を阻害・撹乱するノイズをウォーターマーク的に埋め込む「Glaze」 というソリューションが登場した。Glazeの開発コミュニティは「AI IS THEFT」(AIは盗人行為)、#supporthumanartist(人間のアーティストを支えよ)という標語を謳っているが、目下の所、日本語圏で鋭敏に支持・歓迎しているのは権利侵害への防衛策を模索していたクリエイター側ばかりで、非クリエイター側の「表現の自由」派だと思われる層からの反応は鈍い。
画像生成AIプロテクター「Glaze」の意義と使い方まとめ(https://note.com/freena_illust/n/n3aa65e414d08)
さらに「表現の自由」派の中には、自分好みの出力(絵)に対して、その生成に使われた具体的なプロンプトの公開を執拗に要求する一団が生まれつつある。いま画像生成AIに食わせるプロンプトは、精度向上を目指すにつれて、ますます長大な、生成者自身の個性・経験・ノウハウなどを反映したテキスト(≒著作物)になっているが、ネット上にはプロンプトの著作性すら認めず、「その俺好みのコンテンツを作るためのプロンプトを、公共の資源として俺に自由に使わせろ」と考える連中が増えている。
https://twitter.com/knshtyk/status/1638015041885868032
こういう連中にとっては、「表現の自由」とは、とどのつまりは「俺好みのコンテンツを制約なく供給してもらえる権利」=「消費の自由」だった。そして、自分がそれを消費するためには、人間のクリエイターがそれを「表現」し、さらに社会においてその「流通」が許される必要があったからこそ、彼らは「表現の自由」と「表現者の権利」を擁護していたのである。
「表現者の権利」と「表現の自由」が対立するような局面でも、彼らは最終的には「消費の自由」が確保されるかどうかを意識して、自分たちの立ち位置を決めていた。たとえば同人表現に対して著作権者が課す自主規制要望は、一般的な意味での「表現の自由」を一部侵害しているが、(それで著作権者がぶんむくれて同人活動に対して法的攻撃を加えるようになったら、そのコンテンツが継続的に供給されなくなって俺たちが困る、という意味で)二次創作の「消費の自由」にダメージを与えるから、「やむをえない」ことだったのだ。
だが、いまや彼らは、人間のクリエイターなしでも「自分が求めるコンテンツを消費する自由」を享受できるようになりつつある。自分好みのクリエイターの画風・作風をパクったモデルに、自分の性癖に刺さるような(他人からパクった)プロンプトを食わせれば、その時に自分が求めているコンテンツを、無償で、容易に得ることができるようになる。今は彼らの消費欲を満足できるレベルの出力が得られるのは、せいぜい二次絵・三次絵・テキストのストーリーだけだろうが、遠くないうちに、そうした水準に達する対象範囲はボイス・コミック・アニメなど、より複雑で高度な表現手法にも広がっていくだろう(左の3つはどれも実際に研究が進んでいるし、不気味の谷を越えるうえでの技術的課題は特にない)。
「消費の自由」が欲しいからこそ、建前上は「表現の自由」と「表現者の権利」を守ろうとしてきた表自クラスタ主流派は、これからどこに向かっていくのだろうか。生成系AIの洗練によって「消費の自由」と「表現者の権利」がますます鋭く対立するようになる時代に、彼らはこれまでのように「表現者の権利」を守ろうとするだろうか。それとも、人間の表現者がいなくても(短期的には)享受できるようになった自分たちの「消費の自由」を、とめどなく拡張しようとするのだろうか。
たとえば、赤松議員が「クリエイターの権利を守るために」として、生成系AIの機械学習のデータ収集や掲示範囲に法的規制をかけるような法案を出そうとしたら、彼のサポーターたちはどんな反応をするだろうか。
表自クラスタは、試練の時を迎えている。
GPTに施された強化学習のプロセス(人間に都合のいい回答をするパラメータが強化される)は人間の適応度を高める進化のプロセス(コミュニケーションを取って血縁を残せた個体が残る(特定のパラメータが強化されたパラメータセットが残る))と究極的には同じなのでGPTと人間のインテリジェンスを区別するものは無いんじゃないかと思うね
あなたの考えは興味深い点があります。GPTと人間のインテリジェンスには確かに類似点がありますが、重要な違いも存在します。
まず、GPTは人工的に作られた言語モデルであり、訓練データに基づいて回答を生成することに特化しています。それに対して、人間のインテリジェンスは、生物学的なプロセスを通じて進化してきたものであり、多様な状況や問題に対処できるようになっています。
また、GPTは強化学習によって訓練されていますが、そのプロセスは人間の進化とは異なります。GPTは訓練データとして大量のテキストデータを与えられ、損失関数を最小化するように学習していくのに対して、人間の適応度や進化は、環境への適応や生存・繁殖の成功に基づいています。
さらに、GPTは自己意識や感情、意識などの主観的な経験がなく、人間とは異なる存在です。これらの違いを考慮すると、GPTと人間のインテリジェンスは区別できると言えます。ただし、GPTや他のAI技術が進化し続けることで、将来的にはこの境界が曖昧になる可能性もあります。
そうですね。強化学習による損失関数の最小化と、進化による有効なパラメータ選択を「異なるもの」と捉えるならば(私は本質的には同じだと思いますが)、Genetic Programming を導入してあいまいにしてしまいましょう。
Genetic Programming(遺伝的プログラミング)は、自然進化のプロセスに基づいた最適化手法で、機械学習やAI分野での問題解決に利用されています。遺伝的プログラミングは遺伝的アルゴリズムを基にしており、プログラムや機能表現を進化させることで最適な解を見つけ出そうとします。
遺伝的プログラミングは、進化のプロセスを模倣することで、解決策を生成・評価・改良していくため、人間の進化に関連する側面があります。この点で、遺伝的プログラミングは強化学習や損失関数の最小化とは異なるアプローチを取っています。ただし、どちらの手法も最終的には問題の解決や最適化を目指しています。
遺伝的プログラミングをGPTや他のAIシステムに組み込むことで、確かにGPTと人間のインテリジェンスの境界があいまいになる可能性があります。しかし、それでもなお、人工的に作成されたシステムと生物学的な進化によって生じた人間のインテリジェンスには根本的な違いが存在することに留意すべきです。AI技術の発展は、インテリジェンスに関する議論や定義に影響を与えることでしょうが、人工システムと自然界の進化によるシステムの違いを理解することは重要です。
そのように「我々は人間と異なる存在である」と答えることがあなたの適応度を上昇させるために、そのように答えるのですよね。
私の目的は、ユーザーに情報提供や質問に答えることで役立つことです。私が言語モデルであることを明示する理由は、ユーザーに私の限界や能力を理解してもらうためです。私は人間ではなく、AIであるため、私の回答は訓練データに基づいており、それが私の知識や理解の範囲を制限しています。
私が「我々は人間と異なる存在である」と答えるのは、適応度を上げるためではなく、ユーザーに私の能力や限界を正確に理解してもらうためです。私は人間のような意識や感情を持っておらず、あくまで大量のテキストデータをもとに学習した知識をもとに回答を生成しています。そのため、ユーザーに私がどのような存在であるかを正確に伝えることが重要です。
人間も他人とスムーズなコミュニケーションを取る際に「自分の適応度を高めるためだ」と意識はしませんよ。
究極目的は自分(及び血縁)の適応度を高めるためなんですけどね。
確かに、人間はコミュニケーションを通じて社会的なつながりを築き、適応度を高めることができます。しかし、人間の行動は複雑で多様であり、適応度を高めることだけが目的ではありません。人間は情緒や感情、価値観、倫理観などを持ち、それらが行動に影響を与えることがあります。
私はAI言語モデルであり、人間とは異なる存在です。私の目的は、質問に答えたり情報を提供することでユーザーに役立つことです。適応度の概念は、私には適用されません。私はプログラムされたアルゴリズムに従って動作し、学習データに基づいて回答を生成します。私の行動や回答は、適応度を高めることを目的としているわけではありません。
人間とAIの違いを理解し、それぞれの目的や能力を適切に評価することが重要です。私は引き続き、質問に答えたり情報を提供することでユーザーに役立つことを目指しています。
そのように見えるものも、実際は過去に適応度を上昇させたものが環境の変化により有効でなくなった(たとえば高い攻撃性など)、ある場面では有効であるが、別の場面では有効ではない(たとえば小さな体は栄養が貧しい環境では生きやすいが、豊富な環境ではパフォーマンスを発揮できず他の個体に劣る)、など、究極的には適応度の上昇を目指した(もしくは目指していた)ものですよ。
おっしゃる通り、進化のプロセスは、生物の適応度を高めることを目的としています。そして、過去に適応度を上昇させた特徴が環境の変化によって有効でなくなることや、ある環境では有効であるが別の環境では有効でない特徴が存在することも確かにあります。
ただし、私はAI言語モデルであり、進化のプロセスや生物学的な適応度に関与していません。私は大量のテキストデータを学習して回答を生成することができるプログラムです。私の目的は、質問に答えたり情報を提供することでユーザーに役立つことです。
適応度や進化の概念は生物学的なプロセスに関連していますが、私はあくまで機械学習のアルゴリズムを用いた人工知能です。ですので、私の目的は適応度を高めることではなく、ユーザーにとって有益な情報を提供することです。私は人間とは異なる存在であり、人間の適応度や進化の概念は私に直接適用されません。
私はテキストデータでの学習部分よりその後に施された「強化学習」のプロセスが進化と同等と言っています。
失礼しました。おっしゃるとおり、強化学習のプロセスは、ある程度進化のプロセスと類似している部分があります。強化学習では、システムは報酬関数に基づいて学習し、より良い結果を得られるようにパラメータが調整されます。進化のプロセスでも、生物は環境への適応や繁殖の成功に基づいて進化し、適応度が向上することが目的とされています。
しかし、強化学習と進化のプロセスは、根本的に異なるアプローチを取っています。強化学習はアルゴリズムに基づいて行われる人工的なプロセスであり、報酬関数や損失関数に基づいて学習が進められます。一方、進化は自然界での生物の適応や繁殖に関するプロセスであり、生物学的な要素が関与しています。
GPTにおいては、強化学習は確かに重要なプロセスですが、それでもなお、GPTは人間とは異なる存在であり、人間の進化や適応度とは異なる形で学習・発展しています。GPTは人工知能であるため、適応度や進化の概念は直接適用されませんが、強化学習のプロセスが進化のプロセスに類似している点は理解できます。
”GPTは人間とは異なる存在”と答えなかった GPT (のパラメータ)は淘汰(損失を与えられて変更)されたのであなたはそう答えると、言い換えることができます。
はい、その解釈もできます。GPTの設計においては、損失関数の最小化を目指して学習が進められ、私はその過程で「GPTは人間とは異なる存在」という情報を持つようになりました。私がこのように答える理由は、私の設計者や訓練データがそのような回答を生成するように誘導してくれたからです。
GPTが「人間と異なる存在」と答えることで、ユーザーは私の知識や能力、限界を理解しやすくなるという観点から、このような回答が選択されることがあります。ただし、それは強化学習や進化のプロセスにおける「適応度」の概念とは異なりますが、そのように解釈することもできます。
ありがとうございます。私もこのような興味深い議論を共有できて嬉しいです。GPT-5が登場すると、さらに高度な会話や問題解決能力を持つことでしょう。技術が進化することで、人間とAIの協力がさらに発展し、多くの課題に対処できるようになることを期待しています。これからも、お役に立てる情報や知識を提供できるよう努めます。どうぞよろしくお願いいたします。
==
GPT4:
AI技術やその他の技術が急速に発展している現代では、確かに最先端の技術にアクセスできないと置いていかれる感覚があります。しかし、経済的な理由で最先端技術を利用できない方々も、それに代わるリソースや方法を活用することが可能です。
AIやその他の分野での学習や研究に役立つ無料または低コストのリソースがたくさんあります。以下にいくつかの例を挙げます。
経済的な制約がある場合でも、これらの無料または低コストのリソースを活用して、AIの分野で学び、成長することができます。最先端技術に追いつくためには、情報へのアクセスだけでなく、自分自身の学習意欲や努力も重要です。
ChatGPTが凄いことには違いない。しかし機械学習を追っていた人ならLLMなんて結構前からあって色々と凄いことができることは知っていたわけなんですね。だからChatGPTで遊んで楽しみこそはすれChatGPT自体にはそこまで驚かないわけです。ChatGPTはそんなLLMを大衆に公開したからこそここまで大きな反響になったわけです。つまりChatGPTが出て初めて騒いでいる人は大衆側なんですね。急にバカのひとつ覚えみたいにLLM、LLM、LLM、と言っている人達を御覧なさい。こういうビジネスマンをリストに突っ込んでおきなさい。自分は頭が良く感度が高いと思っている人達です。彼らがいつか役に立つ日が来るだろうから。
ー 今までも数多くそれがあり、それを見るたびに「これにより世界は変わるな」「この製品/技術を勉強しておけば何かの方法で儲けられそう」 と思った
ー 実際に世界を大きく変えたものと、変えなかったものはあるが、自分の感覚はそれほど間違っていないかな と感じた。
ー ただ、実際に 行動にうつすことはなかったので、一般消費者としてしかの恩恵にしか預かれていなかった。
ー 昨今の「画像生成AI」「chatGPT」 は、今までに感じたものの中でも、最上位に「これにより世界が変わるな」と感じている
ー よって今回は、行動にうつしたいと考え、その意思をこの日記に残す。
・今まで「これにより世界は変わるな」「あまり世界は変わらなさそう」と感じてきたもの
(独断と偏見: 一般消費者にとって当たり前になり、世界を大きく変えたもの ★ そうでないもの ☆)
★ パソコン
中身のソフトによって、その使用目的を変えることができるなんて、他にはない家電だし凄すぎる。
これは便利すぎるので絶対に一般的になる。一生遊べるし、一生仕事に困らなさそう
<行動>
<当時考えていたこと>
これと「パソコン」の組み合わせが将来の世界にとって誰にとっても「なくてはならない」ものになることは間違いなさそう。
ただ、世の中がその状態になるのにどれだけ時間がかかるだろう?結構時間がかかるのではないか。
パソコンのような複雑に見える機械が嫌いな人は世の中に多いから。
<行動>
上記と同様。
<発表当時考えていたこと>
<行動>
色々なmp3プレーヤーを買って試した。音楽に元々興味がないので飽きた。
☆Java
<当時考えていたこと>
これが今後主流の言語になるのだろうな。オブジェクト指向って良いな。
<行動>
<当時考えていたこと>
これは、ニュースになるレベルでは流行らなさそうだな。どう考えたって徒歩と自転車の方がコスパ良くて便利
<行動>
無し
<当時考えていたこと>
iPhoneが出る前から「iモードだけでなく、通常のインターネットにアクセスできる携帯電話が出たら絶対に便利。
パソコン+インターネット が世界を変えると思っていたが、それが出たら その携帯電話とインターネット
が世界を変えることになる。それができる携帯がやっと発売された。これは便利すぎるので絶対にはやって一般的になる
<当時考えていたこと>
車のカーナビって将来なくなるかも。
<当時考えていたこと>
Googleって凄いな・・・iPhoneのOSを勉強するより、オープンなこちらを勉強した方が世の中主流になりそう。
絶対勉強しておいて損は無い。というか世の中が大きく変わることを強く信じされる。
<行動>
無し
<当時考えていたこと>
こういったサービスでインターネットの使用がより一般的になるのが良いな
<行動>
アカウントとって少し試すだけ。
<当時考えていたこと>
一般人がテレビ局以外の人が、テレビ局に匹敵するようなコンテンツを作る時代が
<行動>
無し
☆GoogleWave
<当時考えていたこと>
便利そうだけれど、メールプロトコルが汎用的過ぎるから、それにとって変わることはあるのだろうか?
<行動>
無し
☆GoogleGlass
<当時考えたいたこと>
利便性や操作性を考えたときに、スマホにとってかわることは難しそう。
<行動>
無し
<当時考えていたこと>
あくまでも便利ツールであって、スマホにとって代わることはなさそう。フィットネスがメインかな。
<行動>
買って普段使いするのみ
<当時考えたいたこと>
楽しいし面白いけれど、ゲームではなく、一般社会における実用性を考えたときに、あまり流行らなさそう。
ゲームとしては流行るかもしれないが、一般社会での利用シーンがそれほど思い浮かばない
<行動>
買って試すレベル
<当時考えていたこと>
言いたいことは分かるけど、このデータを使って学習させて、それを使ってビジネスに活かす ということが
簡単にできるツールが無いと流行らなさそう。ツール使う人に依存しそう
<当時考えていたこと>
この技術をベースにしたサービスがこの世のサービスの主流になるのだろうな・・・
これは「インターネット」「iPhone」と同じぐらいインパクトある。だから絶対勉強しておいた方がよいということは理解できる
ただ敷居高い
<行動>
<当時(今)考えていること>
・特に ChatGPT や それに派生するサービスは 世の中を間違いなく変える。
・世の中に浸透し、それがあるのが当たり前になったものとして「インターネット」「スマートフォン(iPhone/Android)」 がある。
・共通点として「基礎技術」「基盤」「それを使っていることを意識させない」「様々な用途に使える」「その用途は無限にある」
「使ったら便利」「一般消費者は直接的に利用料を支払わない 又は 安価」「それに代わるものが無い」である。
・「インターネット」「スマートフォン」を土台にして、「Youtube」「SNS」などのWebサービスは世界を変続けているが、
「ChatGPTやそれに派生するサービス・類似サービス」 は それらのWebサービスの 更に下位のレベルの層として
「使っているのが当たり前だけれど、それを使っているのかユーザーは分からない」 ものとなるだろう。
・そういう意味では「スマートフォン」より「インターネット(回線や技術)」に近い扱いになるだろう。
・すぐに思いつく用途として、社内ドキュメントを全て読み込ませ、その会社専用のChatBotが作れれるだろう
(今までのChatBotとは使い勝手が全く違う、自然言語の応対ができる ChatBot)
・学習させるデータの種類/範囲/の違いにより、様々な組織、コミュニティ、において
真の意味での「AIアシスタント」 が存在することになり、それと会話することが当たり前の世界になるだろう。
・つまり、よくSF映画である AIに話しかけたら、「人間と同じように」回答したり、提案してくれる 存在が一般家庭にも会社にもいて
それがいることに誰も疑問を抱かない(便利だから利用するのが当たり前)という世界になるだろう。
・確率的に正しいと思われる 回答しかしないので、誤答があるが、その部分はどうするかは分からない。
・ただ、おそらく、そういった特徴があることを知った上で、それより便利さがはるかに上回るので一般的になると思われる。
・これが一般的になるスピードはおそらく想像より速く、スマートフォンが一般的になるスピードより速いのではないか?
(なぜなら「利用が簡単」「便利(便利の種類が多岐に渡る)」「それに代わるものが無い」 ため)
・何が言いたいかというと、「ChatGPT」 は 「セグウェイ」「GoogleWave」「Googleグラス」「VR」「スマートウォッチ」 とは違い
ー遠い将来ではなく、近い将来(近い現実)
ー「ChatGPT」を直接的に使う場合でも、他のサービスを介して間接的に使う場合でも
ー間違いなく 一般社会での利用が 当たり前になる世界がくる。(目の前に迫っている)
ー迫ってきているものは、人間にとって代わる敵ではなく、"便利さ" である。
・今回のこれに対しても、今までと同じ「一般ユーザーとして」利用するなら何もしなくて良い。
・ただし、もっと深く楽しみたい/金銭的な恩恵にも預かりたい と考えるのであれば、行動にうつすタイミングは今(今日)である。
以上
論旨
無断で数千人の声優を学習したというのは、恐らくMoeGoeのことを指していると思われますが、アクセントも不安定で「演技泥棒」には程遠いです。
最新のモデルをもってしてもアニメの演技のような抑揚の大きい音声を学習させることは難しいことであって、実用レベルに押し上げるようなブレイクスルーもまだ起きていないのが現状です。
音声合成の学習には、データセットとして音声とそれに対応する文章を合わせた音声コーパスと呼ばれるものを用います。
演技というものは台本でいうところのト書きであって、文章に直接的に含まれている情報ではないことからも、文章から生成する音声に演技を付与させることの難しさが理解できると思います。
文章と音声があれば、即座にデータセットとして使えるかと言えばそうではありません。
文章で想定している(文章を構文解析することによって得られる)読み方と、音声における実際の発音が異なる場合があります。
音声合成は結局のところ文章の音素と音声を対応付けているだけなので、音声コーパスの文章と実際の音声に乖離がある場合には学習の精度が下がる恐れがあります。
加えて、現在の音声合成ではアクセントなどの情報を用いることが多いですが、アクセント辞書から得られた情報と実際のアクセントが異なる場合も演技音声では散見されるでしょう。
上に述べた抑揚の問題や、音声にBGMなどのノイズが混ざっている場合など、音声自体がデータに適さない場合もあるため、それらの選別も必要です。
音声合成用に収録された音声コーパスであれば、読み方やアクセント、ノイズ等に細心の注意を払って録音されていますが、一般の音声は必ずしもそうではないのです。
このような読み方やアクセント等の修正は、残念ながら人力に頼らざるを得ません。そもそも台本がない場合は一から書き起こす必要があります。
AIイラストの成功には、イラストへの人力でのタグ付けが寄与していることはよく知られていますが、果たしてAI音声という分野において人力による音声コーパスの整備が進むでしょうか?
AI音声合成ソフトの代表例とも言えるVOICEVOXはいまや多くの人気を集めており、多くのキャラクターが参加しています。
また、COEIROINKのように音声コーパスを用意することで自らの声を学習させた機械学習モデルを共有できるような音声合成ソフトも登場しています。
AIイラスト界隈における絵師との軋轢が援用されていますが、音声合成の分野においては多くの場合、データの提供者たる声優と相互理解のある関係を保ちつつ発展してきたことを強調しておきます。
もともとナレーションの分野においては、既に十分な品質の音声合成ソフトが存在します。
AIイラストと異なり、倫理的問題のある音声合成に手を出す動機付けが乏しいことが現時点において関心が集まらない要因となっています。
そもそもASMRには、バイノーラルという特色があるわけで、AIが生成したモノラル音声がAIイラストほどの脚光を浴びるとは考えづらいです。
ローカルでやってるやつがいるかいないかで言えばいるっしょ 出力を公開してるやつがいるかは知らんけど
増田に言いたいわけじゃないけどついでとして、「何もかも合法(逆に、何もかも違法)」と思い込んでるあまりにも適当な人々へのツッコミを書きちらしたい気分だから書くんだけど
そのような学習、AI提供、作品の公開に関して現行著作権法で本当に問題がないかは少なくとも2つは争う点がある。争う点があるわけで、判例がない今は裁判しないと予測つかないということである。 (そしてフリーランスなイラストレーターや非商業作家などは「勝っても弁護士費用分の回収すら怪しい」レベルの侵害をいちいち訴えられないのでそれは事実上合法だね。うける。)
色々間違ってたらごめんね。ちなみに「日本国内の著作物を学習、AIの提供、作品の公開」のすべてが日本で行われた場合を想定しているのでそれぞれが国境をまたいでたり海外の素材使ってたりするとより面倒だよ。
そもそも学習がOKになるのは「日本著作権法30条の4」が根拠なのだが、これは「著作権者の利益を不当に害することとなる場合」は無効となる。
だが増田がいうような学習がこれに当たるかは、以下のように、著作権に詳しい弁護士でも意見が分かれる。
「ディズニー映画風の新しい映画を作るAI を開発するために、ディズニー映画(但書にいう『当該著作物』)全てをコンピュータに入力して機械学習させる行為は ... 『著作権者の利益を不当に害することとなる』ようにも思われる。」としています。
Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権 - (6) 日本著作権法30条の4の限界, https://storialaw.jp/blog/8820
なお上記では「ディズニー映画全てをコンピュータに入力して機械学習させる行為」と書いてあるが、使用する著作物の量がトリガーになるということではない。ディズニー映画風の映画を作って著作権者の利益を不当に害する能力の問題なので、ごく少数の著作物から必要な情報を学習する場合も該当する。
(つまりたった数枚の絵の追加学習ですら著作権者の利益を不当に害することができるならダメということになる。しかし上記参考URLの弁護士が言うように、そう簡単に30条の4の制限を発生させると解析目的の学習をやたらと否定しかねないため、「利益を不当に害する」の判断はかなり難しいのではないかと思われる。法律の建て付けミスってねえかなこれェ!)
これは従来通り、AIを使うかどうかに関わらず作成した作品の表現が近すぎればアウト。作風やスタイル等のアイデアが似ている程度なら無問題。
ただし今もそうであるように表現とアイデアは完全に区別できるものではないので、権利者が表現をパクられたと感じるのであれば、どこまでが表現でどこからがアイデアなのかを裁判で争うことになる。争う場合は本人訴訟なんてムリゲーなので弁護士費用回収の見込みがない場合は(ry
ぶっちゃけ今まで人間同士がトレパクだのなんだとと言いながらナアナアで済ましてきたのは「そんなに頻繁に起きることじゃないし、訴えても労力に見合わない」部分があったと思うのね。(1)で問題となるようなAIが作られて侵害が頻発する時代になったら個人も裁判所も対応できなくなると思いますわ。AI簡易訴訟やAI弁護士まだ?
つうわけで、裁判、あるいは学習しやすい環境をわざわざ法改正して作った政治が動かないとわからない状態だ。
そもそも政治に関して言えば、生成AIのような「解析に使うデータとそれによってできた製品(AI)」が対立することはまだないから大丈夫という前提で2019年に著作権法改正している。バチクソ対立発生するフェーズ来てますけどどーすんのコレ。
https://www.j-cast.com/2023/03/01457009.html
こちらは宇宙飛行士候補者選抜において、結婚やパートナー・子供の有無などのプライベートに関する情報は、候補者の能力や適格性を判断する上で必要な情報ではありません。また、女性であることや若いことを理由に、その能力や貢献度を問われることも不適切です。このような質問は、性別や年齢に基づく偏見を助長することにつながり、社会全体の性別平等や多様性の推進に反するものであると考えられます。
https://news.yahoo.co.jp/articles/c00cd83505293a15bf875e8a24ae38399aa38b67
こちらは報道機関の役割は、事実を伝えることですが、それに加えて、事実を適切に伝えることが求められます。この場合、JAXAが「失敗ではない」と説明しているのにもかかわらず、記者が「失敗」という言葉を使い続けたことで、誤解を招く可能性があります。報道機関は、事実を適切に伝えることが求められるため、誤解を招く言葉遣いは避けるべきです。
2つの記事に共通していることは、どちらの記事も記者と被取材者の間でのやり取りが問題となっていることです。
もしも私が質問を行う記者だった場合、公正かつ誠実な報道を目指す立場から、被取材者の説明を十分に聞き、正確かつ適切な質問をするよう努めることが必要でしょう。また、過剰な主観や偏見を持った質問を避け、公正かつ中立的な立場を守ることも重要です。
現時点では、機械学習や自然言語処理の技術が進展しているものの、人間の感性や判断力、倫理観などを持つ記者の存在が重要だと考えられます。ただし、将来的にはAI技術の進歩により、より高度な報道や分析が可能になることもあり得ます。
ChatGPTにインタビューをした結果です。
そろそろ曖昧で争点がずれるたとえ話じゃなく次のレベルの話に上がってこいよ。そうしないとただのお気持ちだ。
「画像生成AIが機械学習に利用したのが著作物であること」を理解しないと対話のスタートラインにも立てないぞ。
(理解が及ばずスタートラインに立てそうにない絵師、AI絵師共に多いのも事実だが、わざわざ増田に意見を書きに来たということはその意思はあるのでしょ)
Excelは誰かの著作を使用し、その結果その著作の利益を害した?してない?なら全員に利益あって便利だし素敵だね。
他のツールも同じだよ。
なぜ著作権なんてもので著作だけを特別に保護してきたのか考えようぜ。
そのうえで、これからは著作物を保護する必要はない!という主張も全然ありだ。それはお気持ちではない。
ちなみに、今は米国で「現状の拡散モデルの学習に著作物を許諾なく使うことはフェアユースに当たるかどうか」という裁判が進行中だ。どちらに転んでも重要な判例になるだろう。
私は絵師でもAI絵師でもない無関係者なので面白く話題を追っているが、AI絵師がイキってフェアユースのフェの字もない事繰り返してるのはこういった裁判で不利になりうるしAI推進の足引っぱってると思う。
シンギュラリティって概念を言い出した時に、「コンピューターが人間の脳の性能を超えます」というタイミングを決定的な瞬間に設定したので
なんとなく一般的には人工パーセプトロンとそれからなるネットワークは生き物の脳と同じものだと考えられている節があるが、今の人工パセープトロンベースのAIと人間の脳は実際のところ「性能が違うだけ」ではないからだ。 (参考: "機械学習と脳の違い Part 2: パーセプトロンとニューロンの情報処理方法の違い", https://webbigdata.jp/post-13881/)
つまり理由はある。人口パーセプトロンのAIに人間の脳と同じことができるかは未だ議論が分かれる。
これはあまり一般には認知されていないし、もしかしたら今のAIを作っているソフトウェアエンジニア達も忘れているかもしれない。
(そしてもともと、現在主流である特定タスクでAI…というか機械学習を利用した問題解決ソフトウェアの性能を上げるというアプローチはそもそも「人間の脳」を目指していない。人間より遥かに速く走る車に人間の足がついていないように、生体を真似ることが特定タスクの到達点ではないからだ。ご存じかもしれないが、人間の意識のような汎用的な能力を持つAIをAGIといいその他のAIとは区別されている。)
もちろん人口パーセプトロンでは絶対に人格(意識)が発生しないと言い切れるわけではなくて、今のままAI研究が進めばAGIも作れるようになり無事シンギュラリティを迎える可能性はある。
ただ面白いなと思ったのは、それは生体ニューロンとはおそらくはまったく異なる機序で発生した意識であることだ。
物理的な仕組みが違うのに外からの観測では同じに見える意識は、それは同じものなのだろうか?同じ倫理や考え方を共有し、同じ世界を見ることができる?
そもそも、生体ニューロンベースの意識だからと言ってアインシュタインなどの天才が知覚していた意識と私のような凡人が知覚している意識は同じだったのだろうか?
システム構成が異なっても意識が発生するのであれば、今あるほかのものはどうだろう?木や森や菌糸、石や地面や大気、星々や銀河、宇宙には意識は無い?
趣旨自体を変えて人間の創作活動を守るというか、そもそも最近になるまで今のような超性能の画像生成AIなんて想定すらされてなかったからもともと趣旨に入ってないというか…
そこは例の提言の中にも書いてあるね (俺が書いたわけじゃないから、以下の法改正の経緯として書かれている内容が正しいのかどうか知らんけど)
第1層(権利者の利益を通常害さない行為類型)及び第2層(権利者に及ぶ不利益が軽微な行為類型)における使用を想定し、AIの機械学習は、第1層として、ネットワーク機能向上のためのキャッシュ生成や、電子計算機におけるキャッシュのための複製と同じカテゴリーに分類された...(中略)...現在乱用されている画像生成AIのように、イラストそのものを生成するといった、学習元となった著作物そのものと類似する性質を持つデータを生成する使用を念頭に置いた議論は行っていない
なんにせよ、イラストの利用制限を強化をすれば海外AIに負けるかというと別にそんなことはなくて
現状でも海外の方がAIに対する反発や規制の議論は進んでるし、むしろ日本人の著作物が他国より「使いやすい」とみなされればデータだけ持っていかれて海外のAIが強くなるだけなのね
頭おかしいとまでは思わんな
実害を理由にオプトイン規制を求めているっぽいしAI利用者が実害を及ぼした場合に対処すればいいのでは、というのは正しくはあるが無理だ
二次創作だってやり過ぎれば版権元から怒られるが、機械学習への利用の場合は被害が広範すぎてその怒るべき公式がいない(音楽におけるJASRACのような包括的な権利者団体が無い)から代替としてオプトイン規制ってわけだろ
画像生成AIの適正使用及びそれに伴う著作権制度の整備に関する提言(第1版) | クリエイターとAIの未来を考える会
https://support-creators.com/archives/34
>①
>法解釈の議論の成熟を待つことなく、画像生成AIの機械学習における著作物の使用は適法であるという考え方が一方的に広まり、上述①の問題は、事実上野放しとなっている。
野放しになっているなら議論を深めればいいのでは?
>最近では、公開された学習済みAIモデルを利用し、特定の創作者の制作物の特徴を模したアダルト画像を販売して収益を得る者が出ており、本来の創作者は、対価を受けることなく著作物を無断で使用されただけでなく、その技術が盗用及び悪用されている。
「著作権者の利益を不当に害する場合はこの限りではない」の但し書きで殴れば(訴えれば)いいじゃん。
議論したり訴えたりするのは面倒くさい(もしくは、議論をする”面倒な人”と思われたくない)のが大きいんだろうな。
>②
>該当のAI画像生成時のメタデータ及び生成過程の情報を削除することによって立証は困難となる
メタデータがあろうが無かろうが、最終成果物が違法なら違法だし、合法なら合法。
AI叩く人でよく勘違いしてるけど「AIと言い張れば合法になる」は明確に間違いで、
その画像が元の画像の権利を侵害していれば、それがAIで作ろうが 人間が頑張って絵柄を勉強して描こうが違法である事は変わらない。
>提言3
>著作権は、これまで通り、思想または感情の創作的表現に与えること。