2023-04-02

論文PDFOCRする場合のコツ

研究必要論文が紙媒体しかない、あるいはPDF単体だとめちゃくちゃ高いが図書館複写なら安いということはよくある。

しかし紙論文だとDeepLに放り込んで流し読みができない。

そんなときPDF+OCR化の需要がある。

ScanSnapにはOCR機能はある(検索可能コンテンツに変換)が、これの精度があまり良くない。

"clinical"をなぜか"cUmcal"と置き換えたり、一体どこに目が付いてるんだといいたくなるような文字列に変換してくる。

そんな時にはAdobe公式サイトの、PDF無料Word変換機能が役に立つ。

手順はこうだ。

1. ScanSnapPDFとしてスキャン

2. 検索可能コンテンツに変換

3. 2のPDFAdobe 公式Word変換に放り込む

4. 出力されたWordPDF

これで快適DeepLライフ

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん