機械学習で音声に関する論文をいくつか見たのだけれど、
どこがおかしいのか可視化せず、聴き比べるサイトばかりなのが気になって仕方ない。
スペクトログラムという横軸が時間、縦軸が周波数という中間処理は出てくるが、その図を使ったり性能差がどのあたりにあるのかを図示しない。
もちろん論文なので、数値比較の表は出てくるが・・・
Permalink | 記事への反応(0) | 17:54
ツイートシェア