はてなキーワード: 判例とは
いや、当たり前じゃなくてね?
また、前提条件として、
だから、雑に「民間企業なら当然」とか「公務員だから当然」なんて言うのは似非なのか、少なくともきちんと社内・庁内のコンプライアンス関係の教育を受けた人は言わない。
はOKだが
とか、公務員はもちろん、一般企業でもよほどのワンマン企業でもありえないよ。
ただ、このような話をちゃんと理解して何が問題なのかを理解している人が少なすぎるし、説明できる人は選挙期間中は活動を自粛してしまったりで、理解されないままこんな雑な事態になってる気がする。
みんな、元素法典を忘れたのか?
あいつらは本当に生成AIというツールを求めてたんだよ。そんなやつらが生み出した化け物みたいな研究成果をまとめたPDFファイルを。Novel AI誕生からわずか14日目にはあったんだぞ。
「何百万もあったら、いちいち目通してフィルタリングしないっしょw」
いやいや、やるよこいつらは。みんなの中では「AI絵師=絵を描く練習すらしない怠惰な存在」なのかもしれないが、それは一部の目立ちたがり屋しか見えてない。
優秀なプログラマーもいれば、金持ちもいるし、無限に時間を持つニートもいる。こいつらみんなが協力して、今の生成AIがある。
そして、手軽にセットアップできるようになり、チュートリアルも作られ、誰でも生成AIを使えるようになった今、そのコミュニティも巨大なものになってる。お前らと同じ熱量であっちも一致団結してるんだよ。
多数派vs少数派だと思ってる?違うぞそれは。少数派vs少数派だ。お前らが多数派でvs少数派であったなら、こんなことにはなってないんだよ。もっと早い段階で生成AIは数で潰れてる。
ウォーターマークを付ける、BlueSkyへ移行するのはいいけど、その先はどうすんの?AI絵師に被害を受けた人で集まって、被害者の会を大々的に開いたことはある?
そういうのを定期的に開いて、議論して、法や過去の判例と照らし合わせて、ここが間違ってると指摘する。或いは、こういう法律を制定すべきと議論を交わしたことは?そこまでやらないと。ていうか、やってくれよ。
インターネットで「こんなんされてつらい」「可哀想。気持ち分かるよ」って、こんなことだけやっててどうすんの?今の政府に任せっきりでどうにかなると思う?
俺は生成AIについてはどっちに転んでもいいよ。創作側でもないし、大して使ってもないし。ただ、SNSで不毛な戦い見せられて、進展もなく、ただただ歪みあってるだけの滑稽なもん見せられて辟易としてんだ。
「効いてる効いてるw」ばっかり。しょーもな。
長文うぜぇと思うなら読まなくていいよ。
都合が悪いとかそんなんじゃなくてだな…
nightshadeが生成AIの機能そのものを破壊する攻撃手段ってことは、そこをAI絵師に逆手に取られるかもしれないから、やるならglazeとかウォーターマークみたいな防御手段にした方がいいぞって注意喚起のつもりだったんだが、本当にこれが「憎しみに満ち溢れてる」に見えたんか?
増田がどっち派かは知らんけどさ、決めるのは司法だからな。司法ってのはな、感情が優先されるわけじゃないんだよ。AI規制したいなら、お前らもちょっとは賢い立ち回りをしろって言ってんの。ずるかろうが何だろうが、賢いやつが勝つの。きめぇ世の中だからよ。クソみたいな判例いっぱいあるんだよ。
それからな、BlueSkyに逃げてどうなるんだよ。そんなの主張にも何にもなってないんだよ。ただ逃げただけ。戦うことをやめただけ。民衆から見えないところまで逃げてどうすんだよ。人がいるのはX。そこで戦わないと意味ないだろ。東京から地方に逃げて、地方から声あげて国が何か変えると思うか?見えるとこで戦えよ。TikTokとかあるだろうがよ。規制したいならもっと呼びかけろや。いくら主張したって、人の耳に入らなかったらただの独り言なんだよ。
俺の言うことにすりゃうまく行くとは言わんけど、みんながBlueSky行くっていうから私もついていく〜って、それでどうにかなるとは俺は全く思わんね。
言うてはイカンらしい。
ではバカに「あなたはバカですよ」と教えてやるにはどうすりゃいいのだ。
婉曲に表現してやらねばならない。
「あなたは知性と教養に問題があり不合理な選択と行動をする人ですね」
ストレートに「バカ」と罵ってやるほうがよほど親切ではないのか。
バカはバカでほっとけ、失敗して七転八倒しているのを横目でニヤニヤ眺めてりゃいいじゃないか。
みたいな、冷たいねぇ
俺はバカはバカなりにバカを自覚させ、分相応な慎ましい社会生活を営んでもらえるように誘導してあげたい。
気づかせてあげたい。
冷たいねぇ
てかさ、長げぇのよ、「あなたは知性と教養に問題があり不合理な選択と行動をする人ですね」
「バカだねぇ、キミみたいなバカを雇ってくれるバカな会社はあそこしかないよ、バカな事考えてないで真面目に頑張って働きなよ、バカ」
これを展開すると
「キミは知性と教養に問題があり不合理な選択と行動をする人だねぇ、キミみたいな知性と教養に問題があり不合理な選択と行動をする人を雇ってくれる知性と教養に問題があり不合理な選択と行動をする会社はあそこしかないよ、知性と教養に問題があり不合理な選択と行動をせずに真面目に頑張って働きなよ、知性と教養に問題があり不合理な選択と行動をしなさんな」
読みずれぇし、発話するとして途中で疲れるわ、早口言葉じゃねぇんだから。
で、結局、新語が作られ続ける事になる、新語であれば侮蔑語として認知、社会合意が形成されるまで猶予がありその間は使える。侮蔑語と指定されたら次の新語を作る。
昨今はこういうサイクルになってる。
例えば「あたおか」だったり「チー牛」とか
法的な侮蔑語、侮辱罪に該当する表現は判例で線引されるので新語はセーフなのだ。
そもそも論、バカがバカと指摘されるのはバカに課せられた役務と社会合意すればよかろう。
英米法の国に侮辱罪は無い、あっても限定的な適用しかされない。
たりめぇだ、んなもん民事でやればいいのだ。
バカと罵られてもバカでないなら利口だと反論し立証すれば名誉は失われない、むしろバカと罵った側の失点となる。
リアルバカであれば、バカと気づくチャンスを貰えたのだからむしろ有益ではないか。
こっちは親切で教えてあげてるんだよ。
バカで無いと自負しているなら「バカではないですよ」と一言反論すれば話は終わる
なんでいちいち裁判なんだ?
警察が動くんだ?
実に愚かしい
おすすめで流れてくるツイートが6割カスになった。1割がオモロ、2割が木っ端、残りがPR。
生成AIユーザも反生成AIも、玉木肯定派も参政党肯定派も、ツイフェミもミソジニーも、ゴミのツイートばかり流れてくる。
ワイはXのヘビーユーザである。表のアカウントと裏アカ、リア垢とえちちArt鑑賞垢がある。
どういう使い方をしていればそうなるのかわからないが、表のアカウントでは生成AI肯定派で国民民主党支持者でミソジニーのツイートが、裏では反生成AIで参政党支持者でツイフェミのツイートが流れてくる。
全員が全員自分はまともと思ってツイートするし、実際相手側のカスにレスする形で正しかったりするので価値観が狂う。
でも伸びるツイート、おすすめツイートが極端なものになってきたのでもうダメだ。
いや、もちろん、世論と自分の価値観が完全に一致するとは思わないが、暴言と嘲笑が中心の、自分と価値観が異なる意見で溢れた環境なんかゴメンである。
ゴメンと言った手前、吐き捨てる気持ちで全部書く。全部の意見が正確ではないだろうし、日本語が怪しい部分があるのだろうが許してほしい。
Xの極論ばかり読んで極論に染まったカスのフランケンシュタインの怪物が、荒んだ心を収めるために綴ってるだけだ。
まず玉木、大事な局面で不倫なんかしてんじゃねえよ、何やってんだよ。ちっちぇ~~話題スタートで申し訳ないが普通にダメだろ。不倫。
これは彼らの政策が正しいからではなく、民意を通した選挙で議席を獲得した責任として協議しろという意味だ。別に「わーい手取りが多くなるよ~万歳」で賛成していない。
確かに最低賃金が上昇しているのに103万円の壁がそのままというのはおかしな話という意見は確かである(「国民民主党 2024年重点政策」、20241115アクセス、https://new-kokumin.jp/wp-content/uploads/2024/09/283a7e4db6b502517dcc0ec460e51304.pdf)。
一方で7.6兆円の減収という試算も無視できない。減税する場合何らかの支出を削らなければいけないが、令和6年度一般会計歳出の防衛関係費7.9兆円(「財政に関する資料」、20241115アクセス、https://www.mof.go.jp/tax_policy/summary/condition/a02.htm)に迫る額を、消費の拡大による回収だったり、やりくりだったり、国債だったりで補填するのは厳しいものがある気がする。貴殿(Xユーザ1億人)がどちら側だろうと、このあたりは政治スタンスの違いで自由に国民間で意見を言ってもいいんじゃないかと思うし、進めるならそのあたりの課題を、譲歩するでも調整するでも何でもいいから政府内で解決しろと思う。俺は政治のプロに任せる。
んで、Xだ。不倫どうでもいいって玉木の支持者のツイートが流れてくる。
いいわけないだろ。てめえ。ゆくゆく支持を伸ばしたとして、信用はできなくなっただろ。自分の股間のファスナー10cmを制御できないやつに予算100兆と機密を任せられねえって。
いや、俺だって「そろそろ財務省から玉木近辺のスキャンダルを出せって指示が出るぞ」ってツイートが流れてきたときは「ははは、確かに」って笑ったよ、このタイミングで過去の何らかをほじくり返すようなのが出てきたらオモロいと思ったし、「お~い財務省~ww」ってなってただろうからな。
そしたら選挙前後で不倫してやんの、馬鹿でい。こうなりゃリスク管理面でもモラルでも悪いのは玉木だろ、財務省の陰謀扱いすんな。
(村上某総務大臣から知事会に、てのは玉木が萌やした芽、たてた煙なのでここで言及はしずらい。村上が種を蒔き火をつけたかは断定できねえが、この場合知事会を叩いていても「憶測で」の要件を満たしづらいので)
国民民主党支持者のことをカルトとかなんだと言ってる奴らもいる。確かに今の支持ツイートが熱狂している面はあるし危なっかしい。匿名で投稿しているのも国民民主党に比例で投票しました!って表で言いづらいからってのもある。玉木のダブスタも、ソースを提示されると納得せざるを得ない。
でもな、そういう発言をしているのがれいわ新選組や参政党支持表明者だと、おいおいとなる。あちゃーと思う。
参政党のキャッチコピー「投票したい政党がないから、自分たちでゼロからつくる」には共感するし、れいわ新選組のWeb広告は巧みだったが、あそこは最悪だ。現代科学に基づいた思考の結果、明らかな嘘をベースに政策や主張を進めているからだ。
食の安全に関する政策や処理水放出反対などを通して、私は全く信頼できない。
現代の科学を真実をしていることは、1000年後には笑い話になるかもしれない。それくらい事実を収集するのは難しい。しかし事実でないと現代科学では考えられている主張を行っているなら、最悪だ。それは政治的方針の違いの一言で許容できるものではなく、単なる国の破壊行為である。
そんな科学的価値観の政党なんて危険極まりないと考える。そしてそこを支持してるツイートが流れてくるのは最悪だ。
あ?立憲民主党に共産党?書いてねえだけで普通に嫌いだが、カルトというより自民イヤイヤ党なだけだろ。カルト党ってより馬鹿党。いや、ディープステート云々言ってるし汚染水っつってたし除外しちゃダメか。でもあそこらへんの支持ツイートあんまり流れてこねえから今日はいいや。
とにかく政治的発言の質が下がったから終わりだ。昔からそうだったのかもしれないが、俺の目線やアカウントの質がそこまで下がったのだから俺がタヒぬしかない。
あと身内をアベガーキシダガーにしやがって。実家帰ったときに空気凍ってたぞ。やっぱりインターネットは最悪だ。
次、生成AIユーザと反生成AI。あれ、俺のタイムラインで最も最悪(トートロジー)だ。何故ならゴミとバカの戦いだからだ。見てられない。
あー、声優の方はある程度わかる。声優Aの声を学習したAIを用いて何等か言わせたり歌わせたりすることで、声優Aが被害者になるからだ。言ってないことを言ったことにされたり、そもそも声優Aがやるべきだった仕事を声優Aから奪うことを目的に利用される可能性があるから、享受目的の追加学習と解釈することで(文化審議会著作権分科会法制度小委員会 「AIと著作権に関する考え方について」、20241115アクセス、https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/workingteam/r06_01/pdf/94080501_10.pdf)訴えや裁判を通して主張が通ると思う。
最も、NO MORE無断生成AIのWebサイト(20241115アクセス、https://nomore-mudan.com/#statement)に具体的に何を求めているのか書かれておらず、司法の判断を仰いでいないのは問題なのだが。
なぜか無断でインターネット上の画像を学習に使用していることに対して批判をしている。また、Xが画像を学習に使用するという規約を盛り込むからとかなんとかで対策やら画像削除やらウォーターマークやら、そもそもXから離れるとかいうアクションを起こしている。
もうね、バカかと。上資料でも、「学習目的では有償のデータ」「海賊版データ」を利用する学習は著作権者の利益を不当に害すると判断されるそうだが、インターネットの海に無料で放出したデータを非享受目的の学習に使うことは問題になると解釈できないのが見解だ。にも拘わらず、AI開発・学習段階の土俵で、無断学習とかなんとか言いやがる。土俵が違う。なんで生成AI推進派のテリトリーでタップダンスしてるんですか。バカなんですか。こういうときに法に触れるだろうといわれる追加学習や、明らかに「生成・利用段階」に発生する問題で戦う方が有利だというのに。なりすまし、著作権侵害、脱ぎコラ、このあたりは「生成・利用段階」に起こる問題であり、現行の法律で対応できるというのが生成AIに関する国の解釈のはずだ。
文化庁がガイドラインを出し、弁護士が首を横に振り、日本漫画家協会の理事が利用の際の問題点をまとめている。貴殿は絵のプロかもしれないしその場合尊敬はしているが、法律のプロの解釈につけ入る隙はどこにあるんだ。「法が整備されていないだけでゆくゆくは犯罪でぇ」って言ってる奴いたけど、じゃあ今は無罪の人間をお前は殴ってんじゃねえか。もっと悪ぃ。
あと、Xの規約のやつ、画像削除は自分が先に投稿したものであるという証拠を消すことになるのでおすすめしないかもしれないというのは小耳にはさんだ。すまない、これに関しては本当かどうか真偽不明だが......一応その可能性もあると思うから注意喚起?で、Xから離れてもどこにも学習されない安寧の地はない。鳥籠の中さながら、蜘蛛の巣の上でしかないので、逃げ場はない。Xの規約に同意したと解釈されるのが嫌だって考えは尊重するが......インターネットの公開領域に絵を上げた時点で......と思う。
ないわけねーだろゴミが。
①特定の人間の絵柄を模倣するために追加学習をし、特定の人間から仕事を奪うのなら、文化庁の言葉を借りると「特定のクリエイターを狙い撃ちしたAI学習」として享受目的に該当するだろう。裏方さん(X:@urct)の画風LoRAをCivitAIにて投稿した黒兎フラワークさんの問題はこれに該当する。なお、黒兎フラワークさんの主張を記事(「裏方のLoRA検証記事の感想(11月12日追記)」、20241115アクセス、https://note.com/felelihasima/n/na30c61e715e1)から引用する。
↓-------
>> 裏方さんは「気持ちを切り替えて本業に専念していく所存です。」で、どうにかこの話題を切り上げようとしていますが、もう貴方はAI学習者からすれば永遠にただの養分です。他者から永遠に搾取されるだけの存在でしかありません。「適応出来ないイラストレーターにもう未来などない」現実を直視してください。 <<
↑-------
とのことらしい。取り上げるのも癪だが一番わかりやすく身近な例だったので取り上げる。
②著作権侵害は今やYoutubeShortなんかでも見るようになった。これに関しては権利者が黙認するなら我々はとやかく言えないが、著作権をもつ人間は著作権の侵害をもとに訴えることができるはずだ。
上みたいなことをしている生成AIユーザのことを、ゴミだなと思って見ている。
あと、「生成AIを敵と見做してる」と反生成AIに発言しているのを散見するが、そりゃ敵だろ、商売敵。自分の絵を学習した商売敵、法律はともかく感情としては最悪だろ、そこは許してやれよ。
実は、2行くらい上の文章、本当は、「訴訟を起こさない権利者反AIはバカだし、上みたいなことをしている生成AIユーザがゴミなのである」といいたかった。
潤羽るしあのママであるやすゆき(X:@yasu00kamiki)さんが、裁判を起こすためにクラウドファンディングを行う報である。②の「権利者の許諾なく著作物が使用されていた場合」に該当するのではという訴えである。
ここで、「生成AI被害への訴訟費用のクラウドファンディング」(20241115アクセス、https://ci-en.net/creator/24768/crowdfunding/761)から引用する。
↓-------
>> これを公開したのは私個人では経済的負担が大きすぎるため、ご支援のお願いをするためです。これまでに200万円以上の費用と1年以上の時間を費やしており、今後さらに費用がかかる見込みです。生成AIに詳しい弁護士がほとんどいないため、何人もの弁護士に相談し、何度か担当も変えました。経済的負担だけでなく精神的にも大きな負担となっており、これ以上の自己負担は困難です。 <<
↑-------
ダメじゃねえか。
ダメじゃねえかってのは、反AIのイラストレーターに向けた言葉ではない。むしろ現行法と、現行法で対応可能であるというAI推進派の中で散見される主張、あとさっきの自分に向けてである。
解釈では対応できるそうだが実際は、現行の法で対応できていない OR 訴えを起こす方のノウハウの不足と負担が大きく、被害を訴える段階まで上がれていない。
「今の法律を守ってはいるが無断で学習をしているのが気に入らないから叩く」はバカだが、「今の法律と運用は問題がない」もダメで、「イラストレーターを軽視してもいい」はゴミで、「今の法律を守った範囲でAIを利用することに問題はないが、法律と運用に問題がないとは言えない」が私の考えである。
また、AIの開発は日本だけで解決できる問題ではないのだろう。日本だけが大々的に規制したからといって諸外国で行為Aが許されているならば、世界にAI開発の遅れを取ることや、開発拠点などを外国に移されるだけなのかもしれない。このあたりは完全に門外漢なので言及は差し控えたい。
このトピックについては何度も引用している文化庁のスライドp13から引用し〆させていただく。
↓-------
「考え方」は、あくまで公表の時点における、AIと著作権に関する審議会としての考え方をまとめたものであり、今後も、 「AIと著作権に関する具体的な判例・裁判例の蓄積」、「AIと関連技術の発展」、「諸外国の検討状況の進展」などについて、引き続き把握・収集に努め、「引き続き情報の把
↑-------
悪意への罰則がなされるいい落としどころを探っていただきたい。
tttttttって考えをしてるから、極端な生成AIユーザも反生成AIもゴミとバカに見えるんだよな~~~!!
俺の主張に間違いは多いはずだがここは匿名インターネットなんで好き勝手言わせてもらったぞ!あと結構マイルドじゃねえ?
飽きた!! これはもう飽和した!! 両方のTOPゴミが殴り合ってる。もう引用も返信もしっちゃかめっちゃかでゴミとまともが入り乱れてるし、どっち陣営でもヒスと嘲笑とキチが飛び交ってる。
ヒスは日本語ちゃんと読んで考えて喋れ、突飛な受け答えを期待し、それを模範解答とするな。嘲笑はマジで本当に容姿イジリをやめろよ。「フェミはおばさんばっか」とか「綺麗な人間はフェミにならなくてもいい」とか「チー牛」とか「小太りのおっさん」とか言うなよマジでさ、それを言った時点で負けだよお前の。キチは俺、キエエエエエエエ!!!!
カウンター野原ひろしはちょっと面白いけど著作権守れ。あとはお互いを尊重して対決より解決しろ。男女差別はやめろ、衝突があるなら落としどころを探れ。キチは俺。キエエエエエエエ!!!!
あと痴漢と痴漢冤罪のやつ、男vs女にするなよ、犯罪者vsその他だろうが。あと冤罪だった場合、責めるのは女全体じゃなくて痴漢を訴えた人間(もし冤罪の上で有罪になったとしたら)と警察か検察か司法だろ。あと性犯罪はゴミカス、その上で法に基づいた罰則がなされるべき。
行き過ぎた発言が多すぎてもう興味なくなっちゃったよ、性別間の戦いさ。せめていい男になるつもりでいる、だけ、以上。
てか話変わるんだけど、インターネットの人間、テレビのこと悪く言いすぎだと、ワイカトリポカ思うワケ。
情報の正確さはインターネットが言えたことじゃねえしモラルはインターネットの方がカス、テレビのコンテンツを無断転載して小銭を稼ぐカスもインターネットでは無数にいる。今やテレビも新聞もインターネットも週刊誌も皆違って皆カスだぜ。Edgeのトップ何とかなんねえかな、変な記事ばっかりピックアップしやがって。
共同通信が歴史あるメディアってのが一番信じられねえ。てっきりShare News Japanとかツイ速とかの情報価値だと思ってたから。それでも、それでもどこもかしこも公式に否定されてるデマと根拠が「関係者」かネットの Permalink | 記事への反応(2) | 01:53
というのは半分嘘で
結局バランスなわけじゃん
殺人罪 25年〜
危険運転致死 15年〜
窃盗 5年〜
強盗 15年〜
こんな感じにしてほしい
日本ってなんか有期刑の上限が低いよね??
判例がないから断定できないが、「この作品のデータセットは販売中です」という実績があれば、その作品のデータを現物から勝手に回収するのは違法行為にできる・損害賠償を請求できる可能性はある。
例えばサイトとかには転載対策のウォーターマーク付きのを掲載しておいて、
生成AIの学習素材用にウォーターマークなしの元絵をZIPとかにまとめて
ダウンロードではなく、サイトに掲載してる方の画像が学習されるのは
アウトにできるんだろうか?
またダウンロード時のライセンスで学習のされ方を縛れたりできたりするもの?
商用不可とか基盤モデルのみ可とか。
なんか著作者が得られるべき権利を阻害されたらアウトで例にモデル販売とかがあった気がしたから
上みたいなのもありなのかな?と思って。
(記憶違いは大いにあるので間違っていたら訂正いただけると)
優しいわかる人いたら教えてください。
■追記
ご回答ありがとうございます。
販売中の実績があれば、違法行為にできる可能性はあるのですね。
ただやはり判例がある方が心強いですね。
なんか判例でもあるの?
注意:AI批判目的ではありません。単なる考察結果の共有です。どちらかというと私は思想的にはAI推進過激派です。また、ここでの推測はすべて外れている可能性はあります、あくまで推測です。
DMMボイスという名前から「にじボイス」という名称に変更された。主な変更点は以下。
それ以外は本記事の内容はすべて当てはまるので、以下「DMMボイス」となっている箇所は適宜「にじボイス」へ読み替えて呼んでほしい。
最近AI界隈(?)で話題になっている、20人分のアニメ調キャラクターの声で感情的な音声を簡単に生成することができるAIサービス。
それの学習元に、エロゲーのテキスト音声データが使われているのではないかという話。
まずは性能がかなり高くて楽しいのでみんな遊んでみてください。(そして知ってる声優がいないか探してみてください。)
現時点では何のフィルターもなく、どのような卑語や卑猥なセリフも発話させられる。
ただ、ある特定の雰囲気のパターンのみなぜか音声合成させると吐息のようなものになり、入力文章からかけ離れてしまう。
それは「ちゅぱちゅぱれろれろ」だ。
他にも、例えば「んじゅぷんくっちゅぱ……じゅ……れちゅはぁ……」や「ちゅぷぷっ、んちゅぅ……ちゅくくっ、むちゅぅ……ぢゅるっ、ちゅちゅぅっ」等を試してみてほしい。
ひらがなですべて書かれているので、発音は明確にはっきりしているはずだが、それでもなぜか発音できず吐息のようなものとなる。
一方で、並びはそのままのまま「ふゅととっ、んびゅぅ……こゅねねっ、むびゅぅ……ぞゅけっ、たゅたゅぅっ」や「にゅべべっ、おにゅぅ……にゅけけっ、めにゅぅ……づゅれっ、にゅにゅぅっ。」等は、きちんと文字通り発音される。
さらに、単純に全てカタカナにして、「チュパチュパレロレロ」にしてもきちんと発音される。またちょっと並び替えて「ぱちゅぱちゅろれろれ」は発音される。その他、適当な意味をなさない「ちゅかちゅほぱれもふい」等のランダムな文字列にしても発音される。
他にも、私が試してみた限りでは、上述の謎の雰囲気のテキスト群以外の文章はほぼ正確に文字通りに発音される。
以上のことから、学習データには「ちゅぱちゅぱれろれろ」やその他の上記例のような特定雰囲気のセリフに対して、「その文字の通常の発音通りでないような音声」が対応しているようなデータが使われていることが推測される。
(念の為に書いておくと、音声合成の学習にあたっては、音声とその音声が何を喋っているかというテキストのペアを、大量に学習させる。)
余談であるが、カタカナの「チュパチュパレロレロ」は発音できるがひらがなの「ちゅぱちゅぱれろれろ」は発音できないという事実からは、古くからの音声合成での「日本語文章→音素列(簡単に言えば読みのカナ列)→音声」という流れの単純な音声合成だけでなく、元の日本語からの情報も音声合成に入力していること推測できる。
元の日本語テキストに対して、その音素列に加えて、大規模言語モデルのエンコーダーモデル、いわゆるテキスト埋め込みも音声合成のテキストエンコーダ部分へ注入するというのは、近年の感情豊かな音声合成界隈での一つのトレンドである。
音声合成にあたりAIが「発音の仕方」だけじゃなくて「セリフの意味」も理解する、というわけである。
例えば「ちゅぱちゅぱれろれろ」も、単独では正常な発話ができないが、「はてなは、匿名性を活かした自由な表現が可能となる場として、ちゅぱちゅぱれろれろ、はてな匿名ダイアリーをご利用いただきたいと考えております。」等に文中に紛れ込ませると正常に発話ができること、また文章全体の示す感情によって途中の声音のテンション等が変わること等も、これらの帰結である。
さて、我々は「れろれろれろ……ちゅぱっ、ちゅぶっ……んちゅ、れろっ……ぺろ、ぺろっ……んちゅぅ」のようなテキストが文字通りの発音と対応しない、そのような状況を知っているはずである。そう、エロゲーだ。
エロゲーにはチュパ音という文化がある。これはヒロインが主人公にフェラチオをするシーンで、ヒロインの声優がそのおしゃぶりシーンを汁音たっぷりに演技をするものである。
そこでは、「あぁむ、じゅぶ……じゅぽじゅぽ……ちゅるっ、ちゅ、ちゅっ、ちゅぅぅぅぅ……んっ、んっ、んんっーー!」のようなテキストに対して、そのテキストの通常の文字通りの発音からはかけ離れた、しゃぶりまくり水音出しまくり啜りまくりの演技が音声として与えられる。
よって上記挙動から、DMMボイスの学習元の少なくとも一部には、エロゲーから抽出したデータが使われているのではないかと推測することができる。
界隈では有名な事実だが、エロゲー(R18に限らずノベルゲー一般)からは、1本だいたい(ものによるが)20時間程度の音声とテキストの両方を(多少の知識があれば)大量に抽出することができ、音声合成や音声認識等の音声に関するAIの研究においては非常に貴重なデータとなっている。
よって、大量の「テキストと音声のペア」が必要な音声合成では、特に表に出ないアングラなところで、ひっそりと学習に使われることが多々ある。また特定の声優の声を出そうという意図はなくても、いわゆる音声AIの事前学習モデルとして、すなわち日本語の発音の仕方をAIが学ぶときに必要な大量の音声データとして、そのようなデータを使うことは、一般的とまでは言わないにしても、あることである。
ましてやDMMである。エロゲープレイヤーならば、近年の衰退しつつあるノベルゲー文化はかなりの部分をFANZAに依存していることをすでに知っているだろう(いつもお世話になっております)。
以上のような理由から私はエロゲーが少なくとも学習データに含まれているのではないかと推測したが、そもそものきっかけは、それより前に、単純にいろんなキャラで音声合成させて遊んでいたら、
少なくとも私の耳には「あれこの人あの声優じゃん?」というキャラが何人かいたからである。
久世凛さん(くん?)の人はたぶん声優として有名なあの人だし、ノエラちゃんとか多分一般でも最近いろいろ有名なんじゃなかろうか?(元エロゲー声優出身でそれから表に出てきて大成功していることで有名)
月城 美蘭ちゃんのキャラは某シリーズの某キャラがめっちゃ好きです。
他にも声優に詳しい方だったら、誰の声か分かるキャラが数人はいるのではなかろうか。
さらに実験を重ねていると、エロゲーが学習に使用されていると推測されるもう一つの事象を発見した。
それは「おちんちん」という単語を含んだセリフを音声合成させると、不自然に「おちんちん」の1番目の「ん」がきれて「おちっちん」のように音声合成されるという現象である。
(実際は「おちっちん」ほど極端ではないが、明確に2番目の「ん」の音が通常の発音よりもかなり弱く、不自然に途切れた印象の発音になっている。「おちんつん」等にして比較するとより違いが明確になる。)
このことから、「おちんちん」という単語がそのまま発話されないデータが学習元に多いのではないかと推測できる。
エロゲープレイヤーならば知っているだろうが、大半の商業エロゲーでは規制から「おちんちん」という文字は「おち○ちん」と伏せ字になり音声ではピー音が入る。
このような音声の内部の音声データは、伏せ字部分が抜けて発音されていることが多い(ピー音がそのまま入っているものもある)。
このことも、エロゲーの音声データがDMMボイスの学習元として使われているという推測を支持している。
追記。ブコメ等で、「膣」がなぜか「ナカ」と発音されるという現象の報告が多くあった。また試すと「ナツ」と発話されることも多い。これについて、私よりも音声学に詳しいであろう増田の観察があったのでリンクを貼っておく: anond:20241105060042
端的に言うと、データセットに「膣内に出して……!」等のセリフで「ナカに出して!」と発音されていることが多いことから、本来の読みである「チツ」と「ナカ」との混乱がテキストエンコーダ部分で起きた結果の現象だと推測される。
引用になるが「膣はあけぼの。膣は夜。膣は夕暮れ。膣はつとめて。」を音声合成させてみるのを試してみるとよいだろう。
DMMボイスに対して学習元等の問い合わせをしている人たちが数人はいるようで、開発者サイドのそれに対するリプライの文章から抜粋する。
https://x.com/1230yuji/status/1852914053326483685
「音声学習データは音声データの大量購入、機械合成、収録で取得しています。具体的な情報は企業秘密にあたるため開示できません。」
ここで「音声データの大量購入」という箇所がひっかかる。そう、界隈にいれば知っている人が多いだろうが、音声とテキストのペアのデータセットで、大量購入できるようなものはほぼない(あったら喉から手が出るほど欲しい)。
さらにまた、DMMボイスはアニメ調のキャラクターの音声合成が売りである。そのようなデータセットで、大量購入できるようなものはほぼない(あったら喉から手が出るほど欲しい)。
つまり、ここでの大量購入はエロゲーの大量購入を指しているのではないかと推測することができる。(もしくは、少し前に触れた、すでに公開されているそのような音声データセットから流用したか)。
追記となるが、DMMボイスの利用規約自体が少しおかしいのではという議論を提起している動画があったので紹介しておく: https://www.youtube.com/watch?v=tkBGBVjOIZk
(以前ここで第8条1(1)について書いたいたが、この文言自体は利用規約で一般的なもののようだ、申し訳ない)
音声AIについて昨年5月あたりから品質が大いに向上したことで、AIカバーや声優音声の無断学習等の文脈で、様々な議論が発生している。最近では有名な声優たちがNOMORE無断生成AIというスローガンで大々的に活動している。
これは、声優たちが、自分たちの声が無断でAI学習に使用され、その上で収益化をされていることに対して反対して展開している運動だ。
(この運動に対する是非等の意見は私は持たない、最初に述べた通り私はどちらかというとAI推進過激派である。)
また、このような運動がおこる背景として、(イラストでかなりバトルが発生しているが、)AI学習における「声の権利」との法的な取り扱いが現状の法律だと不明瞭な点から、法律とくに著作権に訴えることでは現状の使われ方に対して法的措置を取りにくいところにある。
このようなAIと音声の権利については最近の柿沼弁護士の記事が参考になるので詳しくはそちらを読んでほしい。
https://storialaw.jp/blog/11344
私自身は法律の専門家でもなんでもないので法的なあれこれについて述べることはできないが、理解している範囲で述べる(間違ってたらすみません)。
音声AIの法的議論では「パブリシティ権」という概念が重要になる。これはざっくり言うと、有名女優の肖像を勝手に商品の宣伝に使ったりすると、その女優が得られたであろう広告収入が奪われたことになるのでダメ、という感じのものである。
このパブリシティ権は現在の日本の法律の文面では明文化されておらず、どこまでがパブリシティ権にあたるのかということについて、特に音声については、未だ判例がなくはっきり分からない。
しかし有名人の氏名についてはパブリシティ権は認められているので、もしDMMボイスが、「あの人気声優○○さんの声で音声合成できる!」としてこのサービスを提供していたら、正式に契約を結んでいた場合に得られたであろう声優の利益のことを考慮すると、声優の許諾がない場合ほぼ確実にダメだと思われる(判例待ちなので断言はたぶんできない)。
だがDMMボイスは、学習元の20人分の声優が誰かや、またその声優からの許諾を得て20人分の声優を使っているかを、うまい具合に言及を避けている。
声優好きな人は声のみからその声優が誰であるかを判定することができる人も多いので、そのような場合に、声優名を伏せていたとしてもパブリシティ権の侵害にあたるかは、おそらくかなりグレーで判例待ち事案である。
そのような意味で、このDMMボイスは(もし裁判等や運動が起これば)音声AIと声の権利に対する法的な解像度を上げ議論を起こすのに貢献する事例になるであろうことは間違いない。
何度か述べている通り、私はAI推進過激派寄りの人間であり、NOMORE無断生成AI等の、最近の声優たちやアンチ生成AIの人達による運動に対しては、事態を注視しているだけの中立的(むしろ逆にガンガン生成AI使っていこうぜという)立場である。
また今回のDMMボイスの公開や今後のサービス展開に対しても、ことさらそれが悪いことだとか、そのようなものは避けるべきだとか、については思っておらず、むしろ「いつか来るだろうなあと思っていたものを大きい企業がようやく出してきたかあ、これで法律や声の権利についての議論や判例が進むかもな」といった程度の感想である。
(そしてDMMボイスのような技術が可能なこと、また実際にそれを学習させてみて個人で楽しむことは、私自身一年前くらいからずっとしており、そこから音声AI界隈をウォッチしていた。)
しかし、最近の声優サイドの運動や時流を見ると、せめて生成できる20人分の声優の許諾を取っているかについて言及しないままでは、アンチ生成AIサイドの批判の格好の的になるだけなのではないかと感じている。
技術的なことになるが、最近の音声AIでは、実在する声優の声から学習させて、しかし音声合成する際には非実在の人物による声音の音声合成が可能である(例えば声優二人の中間の声等)。
それが権利的や法的や倫理的にどうか等は置いておいて、DMMボイスは少なくともそのような措置を取るのがよかったのではないかと個人的には感じている。
(ただ、私の耳が悪いだけで、ホントは「この人の声だ!」と思ったキャラクターは実は全然そうじゃなかった可能性もある。しかしこの「「誰が喋っているかが明確に100%には断言できない」ところが音声AIと声の権利の議論の難しいところである。)
公平のため、最後に「ちゅぱちゅぱれろれろ」が発音できない現象について、エロゲーがDMMボイスの学習に直接使われたという以外に他のありうる可能性をいくつか書いておく。
また端的にありえるのは、他の「ちゅぱちゅぱれろれろ」が発音できないような音声AIをそのまま流用している可能性である。一つ「ちゅぱちゅぱれろれろ」が正常に発話できない音声合成AIライブラリを知っているが、それはデモ動画に私の好きなエロゲーのセリフが堂々と出ていたことから、それの学習元にエロゲーが入っていることはほぼ確実である。
また他に、DMMボイス自体を開発する際にはエロゲーデータは使っておらず許諾を得た声優のみから学習させるが、その学習元となった事前学習モデルにはエロゲーデータが入っていた、という可能性である。前に少し触れた通り、現在の生成AIには学習に大量のデータが必要であり、まず音声AIが発音の仕方を学ぶために、無から正常に発話できるようになるまでには大量のデータが必要である。そのような学習は非常にお金と時間がかかるため、生成AIでは「まず大規模なデータで学習させて事前学習モデルを作る」「次に、その事前学習モデルに対して、話させたい話者のデータで少量追加学習する」というアプローチが取られる場合がほとんどである。この Permalink | 記事への反応(18) | 07:53
高裁判例は「淫行とは青少年を誘惑・威迫・欺罔し又は困惑させる等その心身の未成熟に乗じた不当な手段により行う行為」「単に自己の性的欲望を満足させるための対象として扱つているとしか認められない行為をいう」(1982/3/29/高)https://courts.go.jp/app/hanrei_jp/detail2?id=50269
ほぼ心身未成熟な青少年に対する性行為は淫行、が常識的だと思う
【証明の程度】
主要事実について、どのような状態(心証の度合い、証明度。41 頁参照)になったとき
に、当該事実が認定できるといえるかにつき、判例(最判昭50.10.24 民集29-9-1417、最
判平12.7.18 集民198-529)は、因果関係の証明に関し、経験則に照らして全証拠を総合検
討し、特定の事実が特定の結果発生を招来した関係を是認し得る高度の蓋然性を証明する
ことであり、その判定は、通常人が疑いを差し挟まない程度に真実性の確信を持ち得るも
主要事実について立証責任を負う者は、当該主要事実について高度の蓋然性をもって真
実であるとの確信を抱かせる程度の立証を要する(本証)。これに対し、当該主要事実につ
いて立証責任を負わない者は、その事実の存否について真偽不明の状態に持ち込めば足り
ることになる(反証)。上記の事実認定の構造のイメージ図(8 頁)は、主として本証につ
https://www.courts.go.jp/saikosai/sihokensyujo/sihosyusyu/syusyugaiyou/minsaikyoukan/index.html
ざっとよんだ限り、裁判は真実を追求する場ではなく、レスバトルすると解釈することもできるな
むろん、レスバトルの過程で真実がわかることがあるが、大阪王将事件のように晒した側が嘘つきの前科者で、直接証拠がない状況だと裁判所の判断もそういうのに引っ張られることになる
旧統一教会に対する解散命令が請求されない理由には、いくつかの法的および実務的な側面が関係しています。
1. 法的基準の厳しさ:日本の「宗教法人法」では、解散命令を請求するには特に厳しい条件が求められます。解散命令の根拠となるのは、宗教法人が公序良俗に反する行為をし、公共の福祉に反すると認められる場合であり、相当な証拠が必要です。過去の判例を見ても解散命令が出されたのは、直接的な犯罪行為(例えば、オウム真理教による地下鉄サリン事件など)が認められたケースに限られています。
2. 証拠の収集と確定の困難さ:旧統一教会に対する被害が報告されているものの、それが組織としての統一教会全体による故意の行為と立証するのは容易ではありません。信者の献金や寄付が違法と判断されるためには、組織的な強制や詐欺的な行為が立証されなければならず、現時点では十分な証拠が集まっていないとされています。
3. 宗教団体の表現の自由と信教の自由:宗教団体の活動は憲法で保障された信教の自由に基づくため、政府が解散命令を出すには慎重を要します。宗教団体が関与した活動のうち、信教の自由に関わる領域は法的に保護されるため、解散請求が慎重に扱われるのはこのためです。
4. 政治的および社会的な配慮:旧統一教会は日本国内外で政治的にも影響力を持ってきた歴史があるため、解散請求が政治的圧力や世論に影響される可能性もあります。また、解散命令が実行されることで他の宗教団体にも影響が及ぶことを懸念し、政府が慎重な姿勢を取っているとする意見もあります。
これらの理由から、旧統一教会に対する解散命令の請求には慎重さが求められ、現時点では請求が見送られている状況が続いています。ただし、政府は被害の実態や証拠の有無に基づき調査を進めており、今後の判断次第では請求に踏み切る可能性もあるとされています。