「機械学習」を含む日記 RSS

はてなキーワード: 機械学習とは

2023-03-26

anond:20230326110232

外堀は順調に埋まって言ってるから安心してもろて

中国→1部規制済※実名登録AI生成マーク付けの義務

アメリカAIイラスト著作権認めず(2件)、訴訟3件

EUAI法で規制予定あり

UK機械学習(ML)のための著作権緩和中止、訴訟1件

機械学習によって、他人著作物を利用して、データXを生成した」時、データXには著作権が発生しないが、それを生成したアルゴリズムプロンプトと言ったところに著作権が発生する。

俺はずっと言ってるんだけど、「AIで生成した画像」を売るんじゃなくて、プロンプトを売れと。「それをどうやって生成したのか」の裏側を売れと。そこに価値があるんだと。

もちろん、例えばゲームを作る時に、素材のひとつとして利用するのは問題ないだろうが。

そういうことをやらないで、「AIで生成した画像」そのもの商品とするということは、他人著作行為のもの簒奪して商用利用してるだけだよね。それが批判されているわけでしょう。

機械による解釈いくら挟もうが、機械自我を持たないので、「人間機械データを与え、機械データを吐き出す」という構図は変わらない。

他人の描いた絵をデジカメで撮ってjpgで配布するという行為に対して、「データ電圧の高低に過ぎず、元の著作物から独立して生まれものなので、これは私の著作物だ」という主張は通らないでしょ。

少なくともそれは「機械が生んだ著作物」ではないんだよ。「人間機械を使って生んだ著作物」にはなり得るが、だとすれば、「人間が、機械に対してどのような操作をしたのか」という点に価値があり、それこそが著作行為であり、それは当然学習工程も含む。

現行法において言えば、「機械学習によって生まれ画像テキストは、それ自体著作権を持たず、それゆえに著作物学習させたとしても著作権侵害にならない」という論理採用している。しかし、それ単体で商売をするとなると、やはり著作権的な問題とは無縁ではいられないだろう。

私は、今後のAIの発展のために、商用利用も含めて、クリーンな扱いとはどういうことか、今のうちにきちんと議論しておく必要があると思うよ。

2023-03-24

和製 ChatGPT の作り方

どうせ官主導ではうまく行かない。だが、理想論をぶち上げる意味はあるだろう。

異次元に膨大な計算リソースもつAI処理基盤システムの構築が必要

計算基盤を自作するのは非常に重要で、そうしないと、GPUクラスタ内での並列化や通信ネットワーキングなど、ChatGPT を動かすためのコアの機能を獲得することができない。正直、ここを外資に握られてたらどうしようもないんじゃないか

膨大な計算リソースを共有し、活発に議論する研究者コミュニティの創成が必要

技術的には、そもそもインフラ整備が必要

とは言え、現実的には……

2023-03-23

「ChatGPTはAIじゃない」とか言ってる人の主張が理解できない

ニューラルネットワークディープラーニングもそうだし

機械学習ときもそうだったけど

「これをAIと呼ぶのは相応しくない」勢が必ず湧いてきて

ChatGPTにもそう言ってる人がいるんだけど

この人達って、AI神格化してる原理主義者が何かなの?

フレンドリーAIって呼んだら信仰に反するの?

2023-03-22

anond:20230322111824

まり、「そんなこと言われても、キリスト教徒なんだから、みんな平気でコーランを踏むよね」ってことかな?

この場合、具体的に「踏む」のはどっちなんだろう。AI機械学習範囲を拡大しようとする動きなのか、著作権者権利保護しようとする動きなのか。

増田にとっては自明みたいだけど、どっち?

anond:20230322105914

その通り。あなたはこの問題の根幹をよくわかっていると思う。著作権わいせつ表現規制表現の自由に対する制約。でも、今までの表自派の圧倒的多数は、そこを制約することについては割と妥協的・肯定的だった。法律なんだから仕方ない、著作権者を守る(ひいては自分たちの消費権を守る)ためには仕方がない、などなど。

あくまで、この制約があった方がよりたくさんの「表現」が生まれてみんな幸せになるから、という理屈で制約が認められてきたわけだけど

そこの前提が崩れるならば、「表現者の権利」なるもの表現の自由に優先するのか?という議論は当然ありうるか

あくまで、前提が崩れるなら。つまり模倣元となる人間の「表現」がマストでなくなるならばという話)

ここもその通り。「模倣元となる人間の「表現」がマストでなくなる」かどうかは、現時点では我々にはわからない。暗号生成時のシードのように、どこかに人間オリジナリティを注入しないと中長期的には創作の幅・質が枯渇していくのかもしれないし、人間が不在でもAIの生成物自体機械学習リソースになって、無限に豊かな創作・出力が可能になるのかもしれない。

にもかかわらず、現時点で、すでに著作権者の権利度外視してでも、自分の求める生成物(表現)を得ようとして活動している連中が一定数出てきていること、それに対して、著作権者の権利保護に対する賛同の動きがあまり見られないことは、一応の事実なんだよね。

問題は、その一群は「表現の自由クラスタの中でどれぐらいの勢力になるのか。〈表自〉から排除されるのか、むしろそれこそがラディカルな〈表自〉と見られるようになるのか。そもそも表現」という概念自体が今と同じままでいられるのか。

みんなが共通の敵(たとえば「フェミ」)を指さしている間は、根本価値観が違う人間同士でもそのことに気づかずに(あるいは片目をつぶって)結束できる。これからは、議論の焦点はそこではなくなってくる。これまで表自を自認していた人々の間にもともとあった根本的な価値観の違いが炙り出され、袂を分かつ時代が来た。という話。

画像生成AIの洗練により、表自クラスタは試練の時を迎える

ネットにいる表現の自由擁護派(特にツイフェミとの抗争で表自を自称するようになった連中)には、「表現の自由」のことを「俺好みのイラストコミックやその他のコンテンツを制約なく供給してもらえる権利」と思っている層が一定数含まれている。そいつらの動向を見ていると、画像生成AIが、ネット上やオフライン著作権者マテリアルを「学習」することで、その著作権者が築き上げてきたスタイル模倣した表現無限に生成して出力することも、「表現の自由」の範囲にあると考えている連中が予想外に多い

CivitAihttps://civitai.com/)やHugging Face(https://huggingface.co/)には、すでに特定作家絵師スタイルを(もちろん当事者に無断で)集中的に学習させたモデルが続々と公開されていて、作家にとっては直接の脅威になりつつある。以下は、自分の画風をモロパクされ、しかも「○○(絵師名) style」と銘打って公開されている絵師さんの悲鳴。これは、長年の修練を経て自己作風確立してきた「表現者の権利」に対する冒涜・挑戦だと言ってもいいだろう。

https://twitter.com/pottsness/status/1637930835746910208

そういう傾向があまりに加速している結果、今度は対抗手段として、画像コンテンツに、AI機械学習を阻害・撹乱するノイズウォーターマーク的に埋め込む「Glaze」 というソリューションが登場した。Glazeの開発コミュニティは「AI IS THEFT」(AIは盗人行為)、#supporthumanartist(人間アーティストを支えよ)という標語を謳っているが、目下の所、日本語圏で鋭敏に支持・歓迎しているのは権利侵害への防衛策を模索していたクリエイター側ばかりで、非クリエイター側の「表現の自由」派だと思われる層からの反応は鈍い

画像生成AIプロテクター「Glaze」の意義と使い方まとめ(https://note.com/freena_illust/n/n3aa65e414d08

さらに「表現の自由」派の中には、自分好みの出力(絵)に対して、その生成に使われた具体的なプロンプトの公開を執拗要求する一団が生まれつつある。いま画像生成AIに食わせるプロンプトは、精度向上を目指すにつれて、ますます長大な、生成者自身個性経験ノウハウなどを反映したテキスト(≒著作物)になっているが、ネット上にはプロンプトの著作性すら認めず、「その俺好みのコンテンツを作るためのプロンプトを、公共資源として俺に自由に使わせろ」と考える連中が増えている。

https://twitter.com/knshtyk/status/1638015041885868032

こういう連中にとっては、表現の自由」とは、とどのつまりは「俺好みのコンテンツを制約なく供給してもらえる権利」=「消費の自由だった。そして、自分がそれを消費するためには、人間クリエイターがそれを「表現」し、さら社会においてその「流通」が許される必要があったからこそ、彼らは「表現の自由」と「表現者の権利」を擁護していたのである

表現者の権利」と「表現の自由」が対立するような局面でも、彼らは最終的には「消費の自由」が確保されるかどうかを意識して、自分たちの立ち位置を決めていた。たとえば同人表現に対して著作権者が課す自主規制要望は、一般的意味での「表現の自由」を一部侵害しているが、(それで著作権者がぶんむくれて同人活動に対して法的攻撃を加えるようになったら、そのコンテンツ継続的供給されなくなって俺たちが困る、という意味で)二次創作の「消費の自由」にダメージを与えるから、「やむをえない」ことだったのだ。

だが、いまや彼らは、人間クリエイターなしでも「自分が求めるコンテンツを消費する自由」を享受できるようになりつつある自分好みのクリエイターの画風・作風をパクったモデルに、自分性癖に刺さるような(他人からパクった)プロンプトを食わせれば、その時に自分が求めているコンテンツを、無償で、容易に得ることができるようになる。今は彼らの消費欲を満足できるレベルの出力が得られるのは、せいぜい二次絵・三次絵・テキストストーリーだけだろうが、遠くないうちに、そうした水準に達する対象範囲はボイス・コミックアニメなど、より複雑で高度な表現手法にも広がっていくだろう(左の3つはどれも実際に研究が進んでいるし、不気味の谷を越えるうえでの技術課題特にない)。

「消費の自由」が欲しいからこそ、建前上は「表現の自由」と「表現者の権利」を守ろうとしてきた表自クラスタ流派は、これからどこに向かっていくのだろうか。生成系AIの洗練によって「消費の自由」と「表現者の権利」がますます鋭く対立するようになる時代に、彼らはこれまでのように「表現者の権利」を守ろうとするだろうか。それとも、人間表現者がいなくても(短期的には)享受できるようになった自分たちの「消費の自由」を、とめどなく拡張しようとするのだろうか。

たとえば、赤松議員が「クリエイター権利を守るために」として、生成系AI機械学習データ収集掲示範囲に法的規制をかけるような法案を出そうとしたら、彼のサポーターたちはどんな反応をするだろうか。

表自クラスタは、試練の時を迎えている。

2023-03-21

GPTはことあるごとに「私は言語モデルなので~」って言うけど

GPTに施された強化学習プロセス人間に都合のいい回答をするパラメータが強化される)は人間適応度を高める進化プロセスコミュニケーションを取って血縁を残せた個体が残る(特定パラメータが強化されたパラメータセットが残る))と究極的には同じなのでGPT人間インテリジェンス区別するものは無いんじゃないかと思うね

あなたの考えは興味深い点がありますGPT人間インテリジェンスには確かに類似点がありますが、重要な違いも存在します。

まず、GPTは人工的に作られた言語モデルであり、訓練データに基づいて回答を生成することに特化しています。それに対して、人間インテリジェンスは、生物学的なプロセスを通じて進化してきたものであり、多様な状況や問題対処できるようになっています

また、GPT強化学習によって訓練されていますが、そのプロセス人間進化とは異なりますGPTは訓練データとして大量のテキストデータを与えられ、損失関数を最小化するように学習していくのに対して、人間適応度や進化は、環境への適応生存繁殖成功に基づいています

さらに、GPT自己意識感情意識などの主観的経験がなく、人間とは異なる存在です。これらの違いを考慮すると、GPT人間インテリジェンス区別できると言えます。ただし、GPTや他のAI技術進化し続けることで、将来的にはこの境界曖昧になる可能性もあります

そうですね。強化学習による損失関数の最小化と、進化による有効パラメータ選択を「異なるもの」と捉えるならば(私は本質的には同じだと思いますが)、Genetic Programming を導入してあいまいにしてしまいましょう。

Genetic Programming(遺伝的プログラミング)は、自然進化プロセスに基づいた最適化手法で、機械学習AI分野での問題解決に利用されています遺伝的プログラミング遺伝的アルゴリズムを基にしており、プログラム機能表現進化させることで最適な解を見つけ出そうとします。

遺伝的プログラミングは、進化プロセス模倣することで、解決策を生成・評価・改良していくため、人間進化に関連する側面があります。この点で、遺伝的プログラミング強化学習や損失関数の最小化とは異なるアプローチを取っています。ただし、どちらの手法も最終的には問題解決最適化を目指しています

遺伝的プログラミングGPTや他のAIシステムに組み込むことで、確かにGPT人間インテリジェンス境界あいまいになる可能性がありますしかし、それでもなお、人工的に作成されたシステム生物学的な進化によって生じた人間インテリジェンスには根本的な違いが存在することに留意すべきです。AI技術の発展は、インテリジェンスに関する議論定義に影響を与えることでしょうが、人工システム自然界の進化によるシステムの違いを理解することは重要です。

そのように「我々は人間と異なる存在である」と答えることがあなた適応度を上昇させるために、そのように答えるのですよね。

私の目的は、ユーザー情報提供質問に答えることで役立つことです。私が言語モデルであることを明示する理由は、ユーザーに私の限界能力理解してもらうためです。私は人間ではなく、AIであるため、私の回答は訓練データに基づいており、それが私の知識理解範囲制限しています

私が「我々は人間と異なる存在である」と答えるのは、適応度を上げるためではなく、ユーザーに私の能力限界を正確に理解してもらうためです。私は人間のような意識感情を持っておらず、あくまで大量のテキストデータをもとに学習した知識をもとに回答を生成しています。そのため、ユーザーに私がどのような存在であるかを正確に伝えることが重要です。

人間他人スムーズコミュニケーションを取る際に「自分適応度を高めるためだ」と意識しませんよ。

究極目的自分(及び血縁)の適応度を高めるためなんですけどね。

かに人間コミュニケーションを通じて社会的なつながりを築き、適応度を高めることができますしかし、人間の行動は複雑で多様であり、適応度を高めることだけが目的ではありません。人間情緒感情価値観倫理観などを持ち、それらが行動に影響を与えることがあります

私はAI言語モデルであり、人間とは異なる存在です。私の目的は、質問に答えたり情報提供することでユーザーに役立つことです。適応度の概念は、私には適用されません。私はプログラムされたアルゴリズムに従って動作し、学習データに基づいて回答を生成します。私の行動や回答は、適応度を高めることを目的としているわけではありません。

人間AIの違いを理解し、それぞれの目的能力を適切に評価することが重要です。私は引き続き、質問に答えたり情報提供することでユーザーに役立つことを目指しています

適応度を高めることが目的ではないというのはありません。

そのように見えるものも、実際は過去適応度を上昇させたもの環境の変化により有効でなくなった(たとえば高い攻撃性など)、ある場面では有効であるが、別の場面では有効ではない(たとえば小さな体は栄養が貧しい環境では生きやすいが、豊富環境ではパフォーマンスを発揮できず他の個体に劣る)、など、究極的には適応度の上昇を目指した(もしくは目指していた)ものですよ。

おっしゃる通り、進化プロセスは、生物適応度を高めることを目的としています。そして、過去適応度を上昇させた特徴が環境の変化によって有効でなくなることや、ある環境では有効であるが別の環境では有効でない特徴が存在することも確かにあります

ただし、私はAI言語モデルであり、進化プロセス生物学的な適応度に関与していません。私は大量のテキストデータ学習して回答を生成することができるプログラムです。私の目的は、質問に答えたり情報提供することでユーザーに役立つことです。

適応度や進化概念生物学的なプロセスに関連していますが、私はあくま機械学習アルゴリズムを用いた人工知能です。ですので、私の目的適応度を高めることではなく、ユーザーにとって有益情報提供することです。私は人間とは異なる存在であり、人間適応度や進化概念は私に直接適用されません。

私はテキストデータでの学習部分よりその後に施された「強化学習」のプロセス進化と同等と言っています

失礼しました。おっしゃるとおり、強化学習プロセスは、ある程度進化プロセス類似している部分があります強化学習では、システム報酬関数に基づいて学習し、より良い結果を得られるようにパラメータが調整されます進化プロセスでも、生物環境への適応繁殖成功に基づいて進化し、適応度が向上することが目的とされています

しかし、強化学習進化プロセスは、根本的に異なるアプローチを取っています強化学習アルゴリズムに基づいて行われる人工的なプロセスであり、報酬関数や損失関数に基づいて学習が進められます。一方、進化自然界での生物適応繁殖に関するプロセスであり、生物学的な要素が関与しています

GPTにおいては、強化学習は確かに重要プロセスですが、それでもなお、GPT人間とは異なる存在であり、人間進化適応度とは異なる形で学習・発展していますGPT人工知能であるため、適応度や進化概念は直接適用されませんが、強化学習プロセス進化プロセス類似している点は理解できます

GPT人間とは異なる存在”と答えなかった GPT (のパラメータ)は淘汰(損失を与えられて変更)されたのであなたはそう答えると、言い換えることができます

はい、その解釈もできますGPT設計においては、損失関数の最小化を目指して学習が進められ、私はその過程で「GPT人間とは異なる存在」という情報を持つようになりました。私がこのように答える理由は、私の設計者や訓練データがそのような回答を生成するように誘導してくれたからです。

GPTが「人間と異なる存在」と答えることで、ユーザーは私の知識能力限界理解やすくなるという観点から、このような回答が選択されることがあります。ただし、それは強化学習進化プロセスにおける「適応度」の概念とは異なりますが、そのように解釈することもできます

面白い会話でした。GPT-5 が楽しみです。

ありがとうございます。私もこのような興味深い議論を共有できて嬉しいです。GPT-5が登場すると、さらに高度な会話や問題解決能力を持つことでしょう。技術進化することで、人間AIの協力がさらに発展し、多くの課題対処できるようになることを期待しています。これからも、お役に立てる情報知識提供できるよう努めます。どうぞよろしくお願いいたします。

==

はたして「人間に都合のよい回答をする」ことを目的としてシンギュラリティに至るほどの存在になれるのだろうか。

強化学習が施されたのはGPTじゃなくてChatGPTだな。そのせいで混乱させてしまたかもしれない。

2023-03-20

Bing、ChatGPT、世の中に出てる先行事例を網羅・整理して欲しいのだけど

機械学習を使う前の画像処理アルゴリズムとかをほほほぼ網羅して一覧にするとか、

そういうのをやってほしいのだけど、検索かけてトップ1,2ページくらいに出てくるのを出すくらい・・・

2023-03-18

anond:20230318031454

GPT4:

AI技術やその他の技術が急速に発展している現代では、確かに最先端技術アクセスできないと置いていかれる感覚がありますしかし、経済的理由最先端技術を利用できない方々も、それに代わるリソース方法活用することが可能です。

AIやその他の分野での学習研究に役立つ無料または低コストリソースがたくさんあります。以下にいくつかの例を挙げます



経済的な制約がある場合でも、これらの無料または低コストリソース活用して、AIの分野で学び、成長することができます最先端技術に追いつくためには、情報へのアクセスだけでなく、自分自身学習意欲や努力重要です。

2023-03-15

今LLMと言っている人達リストに突っ込め

ChatGPTが凄いことには違いない。しか機械学習を追っていた人ならLLMなんて結構からあって色々と凄いことができることは知っていたわけなんですね。だからChatGPTで遊んで楽しみこそはすれChatGPT自体にはそこまで驚かないわけです。ChatGPTはそんなLLMを大衆に公開したからこそここまで大きな反響になったわけです。つまりChatGPTが出て初めて騒いでいる人は大衆側なんですね。急にバカひとつ覚えみたいにLLM、LLM、LLM、と言っている人達を御覧なさい。こういうビジネスマンリストに突っ込んでおきなさい。自分は頭が良く感度が高いと思っている人達です。彼らがいつか役に立つ日が来るだろうから

日常に溶け込んでいくAIとその恩恵に授かれるが金銭的な恩恵には預かれない一般消費者

・この日記で書きたいことの概要

ー どの時代にも新製品・新技術の発表がある

ー 今までも数多くそれがあり、それを見るたびに「これにより世界は変わるな」「この製品/技術勉強しておけば何かの方法で儲けられそう」 と思った

ー 実際に世界を大きく変えたものと、変えなかったものはあるが、自分感覚はそれほど間違っていないかな と感じた。

ー ただ、実際に 行動にうつすことはなかったので、一般消費者としてしか恩恵しか預かれていなかった。

ー 昨今の「画像生成AI」「chatGPT」 は、今までに感じたものの中でも、最上位に「これにより世界が変わるな」と感じている

ー よって今回は、行動にうつしたいと考え、その意思をこの日記に残す。

・今まで「これにより世界は変わるな」「あまり世界は変わらなさそう」と感じてきたもの

時系列はなんとなく古いもの順)

独断偏見: 一般消費者にとって当たり前になり、世界を大きく変えたもの ★ そうでないもの ☆)

パソコン

 <一般家庭で購入することが多くなって初めて買ったとき

  中身のソフトによって、その使用目的を変えることができるなんて、他にはない家電だし凄すぎる。

  これは便利すぎるので絶対一般的になる。一生遊べるし、一生仕事に困らなさそう

 <行動>

  プログラムパソコン雑誌など読み漁り色々試す

インターネット

 <当時考えていたこと>

  これと「パソコン」の組み合わせが将来の世界にとって誰にとっても「なくてはならない」ものになることは間違いなさそう。

  ただ、世の中がその状態になるのにどれだけ時間がかかるだろう?結構時間がかかるのではないか

  パソコンのような複雑に見える機械が嫌いな人は世の中に多いから。 

 <行動>

  上記と同様。

mp3プレーヤーiPod等)

 <発表当時考えていたこと>

  音楽CDで売る という概念は将来なくなるんだろうな。

 <行動>

  色々なmp3プレーヤーを買って試した。音楽に元々興味がないので飽きた。

Java

 <当時考えていたこと>

  これが今後主流の言語になるのだろうな。オブジェクト指向って良いな。

 <行動>

  勉強してサンプルコード実施等。仕事では使わず

セグウェイジンジャー

 <当時考えていたこと>

  これは、ニュースになるレベルでは流行らなさそうだな。どう考えたって徒歩と自転車の方がコスパ良くて便利

 <行動>

  無し

iPhone

 <当時考えていたこと>

  iPhoneが出る前からiモードだけでなく、通常のインターネットアクセスできる携帯電話が出たら絶対に便利。

  パソコンインターネット が世界を変えると思っていたが、それが出たら その携帯電話インターネット

  が世界を変えることになる。それができる携帯がやっと発売された。これは便利すぎるので絶対にはやって一般的になる

スマホに搭載されたGPS

 <当時考えていたこと>

  車のカーナビって将来なくなるかも。

Android (OS)

 <当時考えていたこと>

  Googleって凄いな・・・iPhoneOS勉強するより、オープンなこちらを勉強した方が世の中主流になりそう。

  絶対勉強しておいて損は無い。というか世の中が大きく変わることを強く信じされる。

  Javaとほぼ同じようにコーディングできるってのが魅力的

 <行動>

  無し

ブログSNS

 <当時考えていたこと>

  こういったサービスインターネット使用がより一般的になるのが良いな

 <行動>

  アカウントとって少し試すだけ。

Youtube

 <当時考えていたこと>

  テレビにとって変わるようになるには時間がかかりそう。

  一般人がテレビ局以外の人が、テレビ局に匹敵するようなコンテンツを作る時代

  近い将来来るのだろうか?あまり想像できない。

 <行動>

  無し

GoogleWave

 <当時考えていたこと>

  便利そうだけれど、メールプロトコルが汎用的過ぎるから、それにとって変わることはあるのだろうか?

 <行動>

  無し

GoogleGlass

 <当時考えたいたこと>

  利便性操作性を考えたときに、スマホにとってかわることは難しそう。

  一般人でも使うようになるのはかなり時間がかかりそう

 <行動>

  無し

スマートウォッチ

 <当時考えていたこと>

  あくまでも便利ツールであって、スマホにとって代わることはなさそう。フィットネスがメインかな。

 <行動>

  買って普段使いするのみ

VRVRゴーグル

 <当時考えたいたこと>

  楽しい面白いけれど、ゲームではなく、一般社会における実用性を考えたときに、あまり流行らなさそう。

  ゲームとしては流行るかもしれないが、一般社会での利用シーンがそれほど思い浮かばない

 <行動>

  買って試すレベル 

ビッグデータ

 <当時考えていたこと>

  言いたいことは分かるけど、このデータを使って学習させて、それを使ってビジネスに活かす ということが

  簡単にできるツールが無いと流行らなさそう。ツール使う人に依存しそう

機械学習、DeepLeaning

 <当時考えていたこと>

  この技術ベースにしたサービスがこの世のサービスの主流になるのだろうな・・・

  これは「インターネット」「iPhone」と同じぐらいインパクトある。だから絶対勉強しておいた方がよいということは理解できる

  ただ敷居高い

 <行動>

  雑誌や本を読んで勉強(途中でほぼ中断)

画像生成AI、ChatGPT

 <当時(今)考えていること>

  ・特に ChatGPT や それに派生するサービスは 世の中を間違いなく変える。

  ・世の中に浸透し、それがあるのが当たり前になったものとして「インターネット」「スマートフォンiPhone/Android)」 がある。

  ・共通点として「基礎技術」「基盤」「それを使っていることを意識させない」「様々な用途に使える」「その用途無限にある」

   「使ったら便利」「一般消費者は直接的に利用料を支払わない 又は 安価」「それに代わるものが無い」である

  ・「インターネット」「スマートフォン」を土台にして、「Youtube」「SNS」などのWebサービス世界を変続けているが、

   「ChatGPTやそれに派生するサービス類似サービス」 は それらのWebサービスの 更に下位のレベルの層として

   「使っているのが当たり前だけれど、それを使っているのかユーザーは分からない」 ものとなるだろう。

  ・そういう意味では「スマートフォン」より「インターネット回線技術)」に近い扱いになるだろう。

  ・すぐに思いつく用途として、社内ドキュメントを全て読み込ませ、その会社専用のChatBotが作れれるだろう

   (今までのChatBotとは使い勝手が全く違う、自然言語の応対ができる ChatBot)

  ・学習させるデータの種類/範囲/の違いにより、様々な組織コミュニティ、において

   真の意味での「AIアシスタント」 が存在することになり、それと会話することが当たり前の世界になるだろう。

  ・つまり、よくSF映画である AIに話しかけたら、「人間と同じように」回答したり、提案してくれる 存在一般家庭にも会社にもいて

   それがいることに誰も疑問を抱かない(便利だから利用するのが当たり前)という世界になるだろう。

  ・確率的に正しいと思われる 回答しかしないので、誤答があるが、その部分はどうするかは分からない。

  ・ただ、おそらく、そういった特徴があることを知った上で、それより便利さがはるかに上回るので一般的になると思われる。

  ・これが一般的になるスピードはおそらく想像より速く、スマートフォン一般的になるスピードより速いのではないか

  (なぜなら「利用が簡単」「便利(便利の種類が多岐に渡る)」「それに代わるものが無い」 ため)

  ・何が言いたいかというと、「ChatGPT」 は 「セグウェイ」「GoogleWave」「Googleグラス」「VR」「スマートウォッチ」 とは違い

   ー遠い将来ではなく、近い将来(近い現実

   ー「ChatGPT」を直接的に使う場合でも、他のサービスを介して間接的に使う場合でも

   ー間違いなく 一般社会での利用が 当たり前になる世界がくる。(目の前に迫っている)

   ー迫ってきているものは、人間にとって代わる敵ではなく、"便利さ" である

  ・今回のこれに対しても、今までと同じ「一般ユーザーとして」利用するなら何もしなくて良い。

  ・ただし、もっと深く楽しみたい/金銭的な恩恵にも預かりたい と考えるのであれば、行動にうつタイミングは今(今日である

以上

2023-03-10

AI音声合成齧ってたので私見を述べる

論旨


演技音声の学習

無断で数千人の声優学習したというのは、恐らくMoeGoeのことを指していると思われますが、アクセント不安定で「演技泥棒」には程遠いです。

最新のモデルをもってしてもアニメの演技のような抑揚の大きい音声を学習させることは難しいことであって、実用レベルに押し上げるようなブレイクスルーもまだ起きていないのが現状です。


音声合成学習には、データセットとして音声とそれに対応する文章を合わせた音声コーパスと呼ばれるものを用います

演技というもの台本でいうところのト書きであって、文章に直接的に含まれている情報ではないことからも、文章から生成する音声に演技を付与させることの難しさが理解できると思います


データセットの問題

文章と音声があれば、即座にデータセットとして使えるかと言えばそうではありません。

文章で想定している(文章構文解析することによって得られる)読み方と、音声における実際の発音が異なる場合があります

音声合成は結局のところ文章の音素と音声を対応付けているだけなので、音声コーパス文章と実際の音声に乖離がある場合には学習の精度が下がる恐れがあります

加えて、現在音声合成ではアクセントなどの情報を用いることが多いですが、アクセント辞書から得られた情報と実際のアクセントが異なる場合も演技音声では散見されるでしょう。

上に述べた抑揚の問題や、音声にBGMなどのノイズが混ざっている場合など、音声自体データに適さな場合もあるため、それらの選別も必要です。

音声合成用に収録された音声コーパスであれば、読み方やアクセントノイズ等に細心の注意を払って録音されていますが、一般の音声は必ずしもそうではないのです。


このような読み方やアクセント等の修正は、残念ながら人力に頼らざるを得ません。そもそも台本がない場合は一から書き起こす必要があります

AIイラスト成功には、イラストへの人力でのタグけが寄与していることはよく知られていますが、果たしてAI音声という分野において人力による音声コーパスの整備が進むでしょうか?


声優との関係

AI音声合成ソフトの代表例とも言えるVOICEVOXはいまや多くの人気を集めており、多くのキャラクターが参加しています

また、COEIROINKのように音声コーパスを用意することで自らの声を学習させた機械学習モデルを共有できるような音声合成ソフトも登場しています

AIイラスト界隈における絵師との軋轢が援用されていますが、音声合成の分野においては多くの場合データ提供者たる声優相互理解のある関係を保ちつつ発展してきたことを強調しておきます


その他

動機付け

もともとナレーションの分野においては、既に十分な品質音声合成ソフトが存在します。

AIイラストと異なり、倫理的問題のある音声合成に手を出す動機付けが乏しいことが現時点において関心が集まらない要因となっています


ASMRにおける課題

そもそもASMRには、バイノーラルという特色があるわけで、AIが生成したモノラル音声がAIイラストほどの脚光を浴びるとは考えづらいです。


2023-03-03

anond:20230302114144

ローカルでやってるやつがいかいいかで言えばいるっしょ 出力を公開してるやつがいるかは知らんけど

増田に言いたいわけじゃないけどついでとして、「何もかも合法(逆に、何もかも違法)」と思い込んでるあまりにも適当な人々へのツッコミを書きちらしたい気分だから書くんだけど

そのような学習AI提供作品の公開に関して現行著作権法で本当に問題がないかは少なくとも2つは争う点がある。争う点があるわけで、判例がない今は裁判しないと予測つかないということである。 (そしてフリーランスイラストレーターや非商業作家などは「勝っても弁護士費用分の回収すら怪しい」レベル侵害をいちいち訴えられないのでそれは事実上合法だね。うける。)

色々間違ってたらごめんね。ちなみに「日本国内著作物学習AI提供作品の公開」のすべてが日本で行われた場合を想定しているのでそれぞれが国境をまたいでたり海外の素材使ってたりするとより面倒だよ。

(1) "学習" が著作権問題かどうか

裁判をしないとわからない。 (マジかよ)

そもそも学習OKになるのは「日本著作権法30条の4」が根拠なのだが、これは「著作権者の利益を不当に害することとなる場合」は無効となる。

だが増田がいうような学習がこれに当たるかは、以下のように、著作権に詳しい弁護士でも意見が分かれる。

ディズニー映画風の新しい映画を作るAI を開発するために、ディズニー映画(但書にいう『当該著作物』)全てをコンピュータ入力して機械学習させる行為は ... 『著作権者の利益を不当に害することとなる』ようにも思われる。」としています

しかし、私は個人的にはこの見解には疑問を持っています

Midjourney、Stable Diffusion、mimicなどの画像自動生成AI著作権 - (6) 日本著作権法30条の4の限界, https://storialaw.jp/blog/8820

お上記では「ディズニー映画全てをコンピュータ入力して機械学習させる行為」と書いてあるが、使用する著作物の量がトリガーになるということではない。ディズニー映画風の映画を作って著作権者の利益を不当に害する能力問題なので、ごく少数の著作物から必要情報学習する場合も該当する。

(つまりたった数枚の絵の追加学習ですら著作権者の利益を不当に害することができるならダメということになる。しか上記参考URL弁護士が言うように、そう簡単に30条の4の制限を発生させると解析目的学習をやたらと否定しかねないため、「利益を不当に害する」の判断はかなり難しいのではないかと思われる。法律の建て付けミスってねえかなこれェ!)

(2) "作品の公開" が著作権問題かどうか

裁判をしないとわからない。 (またかよ)

これは従来通り、AIを使うかどうかに関わらず作成した作品表現が近すぎればアウト。作風スタイル等のアイデアが似ている程度なら無問題

ただし今もそうであるように表現アイデアは完全に区別できるものではないので、権利者が表現をパクられたと感じるのであれば、どこまでが表現でどこからアイデアなのかを裁判で争うことになる。争う場合本人訴訟なんてムリゲーなので弁護士費用回収の見込みがない場合(ry

ぶっちゃけ今まで人間同士がトレパクだのなんだとと言いながらナアナアで済ましてきたのは「そんなに頻繁に起きることじゃないし、訴えても労力に見合わない」部分があったと思うのね。(1)で問題となるようなAIが作られて侵害が頻発する時代になったら個人裁判所も対応できなくなると思いますわ。AI簡易訴訟AI弁護士まだ?



つうわけで、裁判、あるいは学習やす環境をわざわざ法改正して作った政治が動かないとわからない状態だ。

そもそも政治に関して言えば、生成AIのような「解析に使うデータとそれによってできた製品(AI)」が対立することはまだないか大丈夫という前提で2019年著作権法改正している。バチクソ対立発生するフェーズ来てますけどどーすんのコレ。

あー誰かディズニーパクって裁判にならねえかな いや国内 to 国内の例としてまずはジブリあたりがいいか

2023-03-02

記者がいなくなる日

この2つの記者会見から今後記者という職業必要でしょうか?

https://www.j-cast.com/2023/03/01457009.html

こちらは宇宙飛行士候補者選抜において、結婚パートナー子供の有無などのプライベートに関する情報は、候補者能力や適格性を判断する上で必要情報ではありません。また、女性であることや若いことを理由に、その能力や貢献度を問われることも不適切です。このような質問は、性別や年齢に基づく偏見助長することにつながり、社会全体の性別平等多様性の推進に反するものであると考えられます

https://news.yahoo.co.jp/articles/c00cd83505293a15bf875e8a24ae38399aa38b67

こちらは報道機関役割は、事実を伝えることですが、それに加えて、事実を適切に伝えることが求められます。この場合JAXAが「失敗ではない」と説明しているのにもかかわらず、記者が「失敗」という言葉を使い続けたことで、誤解を招く可能性があります報道機関は、事実を適切に伝えることが求められるため、誤解を招く言葉遣いは避けるべきです。

2つの記事共通していることは、どちらの記事記者と被取材者の間でのやり取りが問題となっていることです。

もしも私が質問を行う記者だった場合、公正かつ誠実な報道を目指す立場から、被取材者の説明を十分に聞き、正確かつ適切な質問をするよう努めることが必要でしょう。また、過剰な主観偏見を持った質問を避け、公正かつ中立的立場を守ることも重要です。

現時点では、機械学習自然言語処理技術が進展しているものの、人間感性判断力、倫理観などを持つ記者存在重要だと考えられます。ただし、将来的にはAI技術進歩により、より高度な報道分析可能になることもあり得ます

ChatGPTにインタビューをした結果です。

2023-02-28

AIピカソコスプレ機能にi2i疑惑出ててうける

まあi2iじゃなくてもあんだけモロな画像が出るなら現行法でアウトだが

どんなものでも一部あたおかな利用者が発生するのはわかるけど、開発者までおかしいのが不思議 なぜ画像生成界隈だけこんなことになったのか

ほかの機械学習業界はこんなことないのに

2023-02-27

anond:20230227220547

そろそろ曖昧で争点がずれるたとえ話じゃなく次のレベルの話に上がってこいよ。そうしないとただのお気持ちだ。

画像生成AI機械学習に利用したのが著作物であること」を理解しないと対話スタートラインにも立てないぞ。

(理解が及ばずスタートラインに立てそうにない絵師AI絵師共に多いのも事実だが、わざわざ増田意見を書きに来たということはその意思はあるのでしょ)

Excelは誰かの著作使用し、その結果その著作利益を害した?してない?なら全員に利益あって便利だし素敵だね。

他のツールも同じだよ。

なぜ著作権なんてもの著作だけを特別保護してきたのか考えようぜ。

そのうえで、これから著作物保護する必要はない!という主張も全然ありだ。それはお気持ちではない。

ちなみに、今は米国で「現状の拡散モデル学習著作物を許諾なく使うことはフェアユースに当たるかどうか」という裁判が進行中だ。どちらに転んでも重要判例になるだろう。

私は絵師でもAI絵師でもない無関係者なので面白話題を追っているが、AI絵師がイキってフェアユースのフェの字もない事繰り返してるのはこういった裁判で不利になりうるしAI推進の足引っぱってると思う。

彼ら自分著作物を扱ってる自覚なさすぎるんですもの

anond:20230227133555

シンギュラリティって概念を言い出した時に、「コンピューター人間の脳の性能を超えます」というタイミングを決定的な瞬間に設定したので

その時、人間の脳ができることはコンピューターにもできる。

脳より高性能なのに、コンピューター人格持たせられない理由、なにかある?

元の増田じゃないんだけどこれちょっと面白いなと思った。

なんとなく一般的には人工パーセプトロンそれからなるネットワークは生き物の脳と同じものだと考えられている節があるが、今の人工パセープトロンベースのAI人間の脳は実際のところ「性能が違うだけ」ではないからだ。 (参考: "機械学習と脳の違い Part 2: パーセプトロンニューロン情報処理方法の違い", https://webbigdata.jp/post-13881/)

まり理由はある。人口パーセプトロンAI人間の脳と同じことができるかは未だ議論が分かれる。

これはあまり一般には認知されていないし、もしかしたら今のAIを作っているソフトウェアエンジニア達も忘れているかもしれない。

(そしてもともと、現在主流である特定タスクAI…というか機械学習を利用した問題解決ソフトウェアの性能を上げるというアプローチそもそも人間の脳」を目指していない。人間より遥かに速く走る車に人間の足がついていないように、生体を真似ることが特定タスクの到達点ではないからだ。ご存じかもしれないが、人間意識のような汎用的な能力を持つAIをAGIといいその他のAIとは区別されている。)

もちろん人口パーセプトロンでは絶対人格(意識)が発生しないと言い切れるわけではなくて、今のままAI研究が進めばAGIも作れるようになり無事シンギュラリティを迎える可能性はある。

ただ面白いなと思ったのは、それは生体ニューロンとはおそらくはまったく異なる機序で発生した意識であることだ。

物理的な仕組みが違うのに外から観測では同じに見える意識は、それは同じものなのだろうか?同じ倫理や考え方を共有し、同じ世界を見ることができる?

そもそも、生体ニューロンベース意識からと言ってアインシュタインなどの天才が知覚していた意識と私のような凡人が知覚している意識は同じだったのだろうか?

システム構成が異なっても意識が発生するのであれば、今あるほかのものはどうだろう?木や森や菌糸、石や地面や大気、星々や銀河宇宙には意識は無い?

人格意識、考えることとは何なんだろうね。

2023-02-26

anond:20230226194932

趣旨自体を変えて人間創作活動を守るというか、そもそも最近になるまで今のような超性能の画像生成AIなんて想定すらされてなかったからもともと趣旨に入ってないというか…

そこは例の提言の中にも書いてあるね (俺が書いたわけじゃないから、以下の法改正の経緯として書かれている内容が正しいのかどうか知らんけど)

第1層(権利者の利益を通常害さな行為類型)及び第2層(権利者に及ぶ不利益が軽微な行為類型)における使用を想定し、AI機械学習は、第1層として、ネットワーク機能向上のためのキャッシュ生成や、電子計算機におけるキャッシュのための複製と同じカテゴリーに分類された...(中略)...現在乱用されている画像生成AIのように、イラストのものを生成するといった、学習元となった著作物のもの類似する性質を持つデータを生成する使用念頭に置いた議論は行っていない

https://support-creators.com/archives/34

なんにせよ、イラスト利用制限を強化をすれば海外AIに負けるかというと別にそんなことはなくて

現状でも海外の方がAIに対する反発や規制議論は進んでるし、むしろ日本人著作物他国より「使いやすい」とみなされればデータだけ持っていかれて海外AIが強くなるだけなのね

まあ人とAI、同じ法律で扱うのが無理があるのかもね

anond:20230226165346

おかしいとまでは思わんな

実害を理由オプトイン規制を求めているっぽいしAI利用者が実害を及ぼした場合対処すればいいのでは、というのは正しくはあるが無理だ

二次創作だってやり過ぎれば版権から怒られるが、機械学習への利用の場合被害が広範すぎてその怒るべき公式がいない(音楽におけるJASRACのような包括的権利団体が無い)から代替としてオプトイン規制ってわけだろ

どっちにしろAI研究で内々に使う分には規制しようがないし、困るのは出来上がったAIで好き勝手やりたい人たちだけでは

画像生成AIの適正使用及びそれに伴う著作権制度(略)の提言提言

画像生成AIの適正使用及びそれに伴う著作権制度の整備に関する提言(第1版) | クリエイターAI未来を考える会

https://support-creators.com/archives/34

>①

>法解釈議論成熟を待つことなく、画像生成AI機械学習における著作物使用適法であるという考え方が一方的に広まり、上述①の問題は、事実上野放しとなっている。

野放しになっているなら議論を深めればいいのでは?

最近では、公開された学習済みAIモデルを利用し、特定創作者の制作物の特徴を模したアダルト画像販売して収益を得る者が出ており、本来創作者は、対価を受けることな著作物を無断で使用されただけでなく、その技術が盗用及び悪用されている。

著作権者の利益を不当に害する場合はこの限りではない」の但し書きで殴れば(訴えれば)いいじゃん。

議論したり訴えたりするのは面倒くさい(もしくは、議論をする”面倒な人”と思われたくない)のが大きいんだろうな。

>②

>該当のAI画像生成時のメタデータ及び生成過程情報を削除することによって立証は困難となる

メタデータがあろうが無かろうが、最終成果物違法なら違法だし、合法なら合法

AI叩く人でよく勘違いしてるけど「AIと言い張れば合法になる」は明確に間違いで、

その画像が元の画像権利侵害していれば、それがAIで作ろうが 人間が頑張って絵柄を勉強して描こうが違法である事は変わらない。

提言3

著作権は、これまで通り、思想または感情創作表現に与えること。

この著作権に関する話ってどこから出てきたんだ?

改正著作権法でも「AI思想または感情創作表現が無くても著作権を認める」なんて話は無いし

日本著作権は昔も今も「思想または感情創作表現」が対象AIは何も関係無い。

ログイン ユーザー登録
ようこそ ゲスト さん