ディープラーニングは音声にも適用されているが、誰かの声を真似ること、から超えられていない。
口の大きさ、呼気量、喉の形、舌の動きといった部分で声が変わると思うが、そういったパラメータを振って、任意の声を出すという方向に向かっていない。
録音と再生はできるようになって、かなり経つが、細かく人の手で調整して綺麗な声を出すという技術が出てこない。
(歪みを加えるとかロボットボイスといったものばかりだ)
Permalink | 記事への反応(0) | 17:05
ツイートシェア