2017-11-14 8 views
1

Adob​​e Acrobat .pdfファイルのリストに回転したテキスト(0度以外のテキスト)が含まれているかどうかを確認する方法があるかどうかを知りませんか?バッチチェック回転したテキストを含むファイルの場合のAdobe Acrobat .pdfの場合

これは簡単だと思っていましたが、私は答えを見つけようとしています。

私はABBYY Recognition Serverを使用して何千ものファイルをOCRしていますが、テキストを回転させると結果は非常に悪いです。私はテキストを回転させたファイルのリストを取得して、それらの前処理を実行できるようにする必要があります。

私は通常、iTextSharpを.pdfの自動化と変更に使用しますが、テキストの回転を確認するためのものは見つけられないようです。

おかげ

答えて

0

のいずれかのワードを回転させた場合は、これらのPDFファイルからのすべての単語を抽出して確認することで、あなたの目標を達成することができます。

PDFライブラリのより高いレベルの能力をタスクに使用することをお勧めします。 Docotic.Pdf libraryは良い選択です(もちろん、私は図書館の開発者の一人です)。ここで

等の位置

各抽出された単語がPdfTextData対象にしていに関する追加情報をextract words from PDFsする方法を示す例です。 PdfTextDataには、単語が回転、拡大縮小、および/または反転されているかどうかを確認するためのプロパティが含まれています(IsTransformed)。変換の詳細については、PdfTextData.TransformationMatrixを分析することもできます。

+0

ご回答ありがとうございます。私は私のソリューションをコーディングする '自由な'方法を望んでいました。 – GoodJuJu

関連する問題