いつも便利に使っている中で不満に思うことが一つ。
OCRの精度が悪い事。
描かれた絵や写真の認識は向上したし音声認識も向上しているのに、事務処理に重要な文字情報の認識が悪いままで困ってる。
スキャンして作られたpdfを読ませると全然ダメ。
直に出力した画像の認識はマシなので恐らくだけど解像度が影響しているように思う。
とはいえ解像度が低い画像は補正して認識するのに、小学生でも読めるような文章ですら読み取れないのは不思議すぎる。
何か特別な理由があるんだろうか。
Permalink | 記事への反応(3) | 17:16
ツイートシェア
今のOCRは古い技術をベースに作られたものが多いから。
最低限の解像度は必要だが、使ってるOCRツールの問題じゃね? BERTとかで補正かける系の技術使ってるものならそこそこ実用的になってると思う
古文の崩し字ですら読み取り可能になりつつ現代において、