大きなPDF文書をファイルの内容に基づいて小さなファイルに分割する必要があります。 BCL easyPDFを使用してPDFファイルを操作します。 easyPDFはページ番号に基づいてpdfドキュメントを分割できますが、ファイルの内容に基づいてドキュメントを分割することはできません。また、それは検索機能を持っていません(私が間違っていると誰かに知らせてください)。pdfファイルを解析する
これで、.netを使用してPDFファイルにテキストの場所を見つける方法を教えてもらえますか?
おかげ
大きなPDF文書をファイルの内容に基づいて小さなファイルに分割する必要があります。 BCL easyPDFを使用してPDFファイルを操作します。 easyPDFはページ番号に基づいてpdfドキュメントを分割できますが、ファイルの内容に基づいてドキュメントを分割することはできません。また、それは検索機能を持っていません(私が間違っていると誰かに知らせてください)。pdfファイルを解析する
これで、.netを使用してPDFファイルにテキストの場所を見つける方法を教えてもらえますか?
おかげ
はこの質問を見てみましょう。あなたはこのようなiText.Netなど.NETでPFDライブラリを必要とする
あなたの要件を満たすことがいくつかのライブラリへのリンクがあります。
あなたの仕事にはDocotic.Pdf libraryをお試しください。
ライブラリはwords with their bounding rectangles from PDFsのコレクションを取得できます。これは、ファイル内のテキストの場所を見つけるのに役立ちます。
ライブラリーをextract text (with or without formatting)に使用することもできます。
免責事項:私はライブラリのベンダーのために働いています。
はい、しかし、それは私たちがまだ言語やプロトコルの機能を学んでいる人を助けるコミュニティであるべきです。それらを正しい方向に向けることができます。 – Brian
PDFは一種のバイナリファイルではありませんか?それをテキストとして解析することはできません。図書館が必要です – Alex