C#WinFormsアプリケーションでiTextSharpを使用してPDFファイルを解析しています。 iTextSharpを使用すると、PDFファイルからテキストデータを簡単に抽出できます。 PDFファイルに2行のテキストで囲まれたイメージが含まれているとします。この場合、画像に関する情報を抽出できませんでした。iTextSharpを使用してPDFファイルから構造要素を取得することは可能ですか?
私の要件がある:
- は、それぞれが例えばタイプテキスト、イメージ、テーブルまたは他の
であるか否かをPDFファイル
text :paragraph1
text :paragraph2
Image:Image
text :paragraph3
Table:table info
text :Paragraph4
このような形式では、テキスト、画像、表、ヘッダー、フッターの情報を簡単に理解できます。
iTextSharpを使用してこのような情報を取得することは可能ですか?はいの場合は、私にこれを教えてください。それ以外の場合は、この要件を満たすことができる他のツールを提案してください。すべての
おかげで、
Saravanan
可能な複製http://stackoverflow.com/questions/5945244/extract-image-from-pdf-using-itextsharp – emd
これはC#4.0固有のものですか? –
@ Ryan Gates:はい...それはC#4.0のためです – Saravanan