2024-11-05

AIは凄く進歩しているのにOCRの精度が悪いのどうして?

いつも便利に使っている中で不満に思うことが一つ。

OCRの精度が悪い事。

描かれた絵や写真認識は向上したし音声認識も向上しているのに、事務処理に重要文字情報認識が悪いままで困ってる。

スキャンして作られたpdfを読ませると全然ダメ

直に出力した画像認識はマシなので恐らくだけど解像度が影響しているように思う。

とはいえ解像度が低い画像補正して認識するのに、小学生でも読めるような文章ですら読み取れないのは不思議すぎる。

何か特別理由があるんだろうか。

  • 今のOCRは古い技術をベースに作られたものが多いから。

  • 最低限の解像度は必要だが、使ってるOCRツールの問題じゃね? BERTとかで補正かける系の技術使ってるものならそこそこ実用的になってると思う

  • 古文の崩し字ですら読み取り可能になりつつ現代において、

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん