2023-03-10

AI音声合成齧ってたので私見を述べる

論旨


演技音声の学習

無断で数千人の声優学習したというのは、恐らくMoeGoeのことを指していると思われますが、アクセント不安定で「演技泥棒」には程遠いです。

最新のモデルをもってしてもアニメの演技のような抑揚の大きい音声を学習させることは難しいことであって、実用レベルに押し上げるようなブレイクスルーもまだ起きていないのが現状です。


音声合成学習には、データセットとして音声とそれに対応する文章を合わせた音声コーパスと呼ばれるものを用います

演技というもの台本でいうところのト書きであって、文章に直接的に含まれている情報ではないことからも、文章から生成する音声に演技を付与させることの難しさが理解できると思います


データセットの問題

文章と音声があれば、即座にデータセットとして使えるかと言えばそうではありません。

文章で想定している(文章構文解析することによって得られる)読み方と、音声における実際の発音が異なる場合があります

音声合成は結局のところ文章の音素と音声を対応付けているだけなので、音声コーパス文章と実際の音声に乖離がある場合には学習の精度が下がる恐れがあります

加えて、現在音声合成ではアクセントなどの情報を用いることが多いですが、アクセント辞書から得られた情報と実際のアクセントが異なる場合も演技音声では散見されるでしょう。

上に述べた抑揚の問題や、音声にBGMなどのノイズが混ざっている場合など、音声自体データに適さな場合もあるため、それらの選別も必要です。

音声合成用に収録された音声コーパスであれば、読み方やアクセントノイズ等に細心の注意を払って録音されていますが、一般の音声は必ずしもそうではないのです。


このような読み方やアクセント等の修正は、残念ながら人力に頼らざるを得ません。そもそも台本がない場合は一から書き起こす必要があります

AIイラスト成功には、イラストへの人力でのタグけが寄与していることはよく知られていますが、果たしてAI音声という分野において人力による音声コーパスの整備が進むでしょうか?


声優との関係

AI音声合成ソフトの代表例とも言えるVOICEVOXはいまや多くの人気を集めており、多くのキャラクターが参加しています

また、COEIROINKのように音声コーパスを用意することで自らの声を学習させた機械学習モデルを共有できるような音声合成ソフトも登場しています

AIイラスト界隈における絵師との軋轢が援用されていますが、音声合成の分野においては多くの場合データ提供者たる声優相互理解のある関係を保ちつつ発展してきたことを強調しておきます


その他

動機付け

もともとナレーションの分野においては、既に十分な品質音声合成ソフトが存在します。

AIイラストと異なり、倫理的問題のある音声合成に手を出す動機付けが乏しいことが現時点において関心が集まらない要因となっています


ASMRにおける課題

そもそもASMRには、バイノーラルという特色があるわけで、AIが生成したモノラル音声がAIイラストほどの脚光を浴びるとは考えづらいです。


記事への反応 -
  • これから先、確実に法規制が必要になる。 現在起きてること ・学習は合法との言い訳の下、オタ技術者が、大量にAIに声優の声と特徴を無断で学習 ・何千人の声が盗まれてるのか、ちょ...

    • 論旨 法律によって制限を設けることは個人的には賛成だが、実際に可能なのか疑問に思う(法律に関する知識がないので詳しい言及は避ける) AI音声合成がAIイラストと同じ轍を踏む...

    • 冷静に考えると 海外の変なアプリの変な宣伝してる変な声優がAIで出来るようになったってことよね しかも変なアプリまで含めてAIが勝手に出来るまであるもんな   いやぁ 知能指...

    • vtuberみたいな感じ?

      • AITuberって言うんやで

        • そうなんだ 紡ネンってのが調べたらいたわ

        • Vtuber存在は、本来それが一番望ましい世界だと思うよ 本物のAIストリーマーが世に出るにはまだ時代が追い付かないから 現実にいない電子だけの存在っていう設定を忠実に守ったコン...

    • その昔、ドラえもんの声を当てられていた、大山のぶ代さんという声優がいらっしゃるんだけども、 あの声は、絶対に大山のぶ代さんにしか出せないとずっと思ってたのね。 ところが...

      • 本題からズレるけどホント声優で唯一無二っていなくていくらでも代替可能だと思うんだよな 不倫した声優とかどんどん交代させたらいい まあファンは結局声の向こうに推し声優の姿...

        • 昨今出てきた推し概念ってのは『この個体を応援したい』ってことだからな 唯一無二だと思い込んでるのはその人を推してる人だけよ でも好きになってしまうとその違いがわかってしま...

      • AI声優が発達するにつれてもなにも、似た声の人間の声優に対して文句言ったり声質を独占しようとする声優なんて聞いたことない気がする 相手が大御所すぎると後続の声優が遠慮して...

    • イラストAIが野放しなんだから音声AIも無規制に決まってるだろ だいたい声なんてのは画力と違って、何千時間もの下積み・練習がいらないんだから、そもそも保護する合理性がない フ...

    • 「包丁で人を攻撃すべきではない」のように「AIは商用に使うべきではない」が新しい道徳になるんじゃないかと予想する

    • 実際のところ声優は滅びてもいいのでは?

    • センスの悪いやつからしたら違いが分からないから取って替わられかねない代物なんだろうが、正直言ってプロと素人じゃ発音も発声も全然違う。聞けば一発。訛りだってプロは一切な...

      • 訛りなんか訓練で直せるものの最たるものじゃんw唯一無二を語りたいなら。演技力とかだろ。発生とかは訓練でどうにかなるけど、そんなんできて当たり前の世界だろ声優なんて。

        • 直ってると思って直せてない奴がゴロゴロいるって話。 あと、人間なら訓練すれば如何ようにもできるかもしれないが本題はAIがそれを完全に自律できるかだ。

      • センスの悪いやつからしたら違いが分からないから取って替わられかねない代物なんだろうが、正直言ってプロと素人じゃ発音も発声も全然違う。聞けば一発。 センスの良いやつにし...

    • いまだに「声真似は犯罪利用が可能だから法規制しろ」とかいうガバガバなコメントが出てくるのが救えねえ Winnyの開発者が逮捕された時代から進歩してない

      • むしろネットの普及に倫理観が高まったからあれこれ言われてるんだろ、いつまで平成初期のオッサンでいるんだよ winnyにギジュツガー擁護とか割れ厨と思われても仕方ないし、...

    • 「思想感情が享受できない利用に限る」の例外規定があるんでAI無罪は通用しないはずなんだが後手後手

    • 芸術家である絵描きと違って声優はただの肉体労働者だからなあ 保護するのは無理かと

    • 中国も規制してくれるといいですね ちなみに中国では中国産のゲームもなぜか日本人声優が声担当している(例えば原神)

    • AI声優は不祥事を起こさないから、イベントなどネームバリューの必要な仕事がなければAIに置き換えられるのか しかしボイスロイドからAI声優まで早かったな、ボイスロイドのASMRは全く...

    • 生身の声帯がデジタル機械声帯に置き換えられるのか 港湾作業員の筋肉がクレーンやコンテナに置き換わったように

    • anond:20230309181817 MEZZOとか 這いよるやつとか

    • デジカメの登場に文句垂れてた町のカメラ屋がどうなったか覚えてないんですか? 結局は何もできずに潰れていったでしょ 今回も同じですよ いい加減学習しましょうや

    • ナレーションとかCMとかゲームは書いてある内容そのままだから仕事取られるかもね アニメってなるとアドリブもあるから総AIにはならないと思う スマホゲームで食いつないでた泡沫声...

    • https://www.gizmodo.jp/2023/02/voice-actors-ai-harassment-campaign.html この記事か フェイクポルノの件もあるしかなり危なそう ボカロぐらい公認されてるものじゃないと安易に使いたくないわ 普通に訴...

    • それよりYouTubeとInstagramの再生回数といいねの数を多量にするAIを作ればいつでも市場を席捲できるわけだな。 名付けてカンナムスタイル

    • せっかくのいい主張なので「ヲタ」「バカ」「言い訳」などの、特に理由のない罵声や断定をやめて、なぜそれがバカなのか、なぜそれが単なる言い訳なのかを理論展開すればいいのに...

      • 18時まで読まれることがなく、トラバもつかないらしいwwww

        • 18時まで読まれることがなく、トラバもつかないらしいwwww 結局ホッテントリになってて涙目の人wwww トラバがないのは要するにぐうの音もでないからだろ。 何の反論も理論...

          • 意味がよくわからないなー ひょっとして相当馬鹿なのかな?この増田は。

            • お前馬鹿じゃない増田に会ったことあるの?それ勘違いか幻術使われてるよ

            • おそらく増田脳というかはてな脳なんだろ。致命的な欠陥があるのだが、不治の病でな。

      • この文章の不快さは何に起因しているのだろう。 確かに元増田は汚い語彙を使っているが、この種の不快感はなかった。 やはり無駄に啓蒙的なところが不愉快に感じるのかな。

      • まってまって。著作隣接権(演者の権利)の存在をまるっと無視してる…!

        • 「著、待てよ!」

        • 誰々風みたいなの概念を保護する法律は無いでしょ、知らんけど

        • ジェネリック声優は著作権的にどういう扱いなんだろ

          • 山田康おの死後の栗田かん一がルパンを演じてる件とかは公式スタッフに依頼されて報酬受け取ってるじゃん、著作権に対価が払われるから別に問題ないのでは。 声優本人であってもD...

    • 声に権利なんかあるのか? AI以下の価値しか出せないような連中はただ消え去るのみ。 悪用は詐欺罪とかそういうのを活用すれば十分。

    • イラストAIの話でなんにも知らないのに絵柄に著作権は無いとか言ってドヤ顔してるバカみたいなのがこれにも湧くんだろうなあ… 絵柄が何を指してるかも知らないくせに知ったかして...

      • 教科書通りの解釈なら絵柄に著作権はないと思うんだけど、違うの? 馬鹿だから教えて!

    • ビルゲイツが「ロボット労働者には税金かけて人間を守るべき」と主張していた 人工知能労働者も税金かけるべき 人工知能で金を稼いだらペナルティが生じる仕組みにしようや

    • https://www.nicovideo.jp/watch/sm39830595 これを誰でもできる時代が来ただけに過ぎない。 今更騒いでるのは逆に面白いし、それだけ一般化されそうになってきたってことだな。

    • AIが現実的になってくると法律を作る人が忙しくなる。法律もAIに作ってもらおう。

      • しれっと「人間はAIの判断を尊重し、異議はこれを認めない」とか混ぜてきそう

    • AI生成音声と、元の声の同一性が「立証」されれば、肖像権も主張できるし賠償金もとれるだろう だれかお金かけて裁判やって、判例を作ってくれ

    • 初音ミクが出てきてただ歌うだけの人は金儲けできなくなったのと同じでしょ

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん