2023-02-07

オレオレAudbleを作ろうとしてる

自炊した書籍PDFデータとかをOCRに噛ませる→更に音声合成システムに噛ませてオーディオブック化するっていうのを試してる

法的にはよく知らんけど私的利用なら多分大丈夫

テキスト化までは成功してて、試しにvoiceboxに読ませてみたんだが流石に誤読が多すぎる

adidasもエーディーアイディーエーエスって読むからなんのこっちゃってなった、まあそういう用途は想定されてないわな

Amazon PollyかGCPText to Speechデモ試したら良い感じだったからこっち試そうかな

毎月400~500万文字くらい無料らしい、そこそこぶ厚めの技術書でも文字数は10万とかだったりするからまあ事足りるかな

明日はそっち試してみよっと

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん