iTextライブラリを使用してPDF文書の各単語の属性(フォント、フォントサイズ、色など)を抽出しようとしています。私はすべてのページからテキストを抽出することができましたが、属性は抽出できませんでした。また、私はそのようなものを提供することができるものは見つけられませんでした。私を助けてください。iTextを使用してpdfファイルからテキストフォントを取得する
答えて
私はJavaの人ではありませんので、私はあなたに作業コードを与えることはできませんが、うまくいけば私はそこに道の95%を得ることができます。メソッドの
PdfTextExtractor.getTextFromPage(PdfReader reader, int pageNumber, TextExtractionStrategy strategy)
ワン:
まず、あなたはその後com.itextpdf.text.pdf.parser.TextExtractionStrategy
あなたは3番目のパラメータとして、このクラスのインスタンスを渡すことができますインターフェイスを実装するクラスを作成する必要がありますは、処理されるすべてのテキストブロックに対して呼び出されるrenderText
です。呼び出されるとTextRenderInfo
が渡され、それにはgetFont
というメソッドがあります。これはあなたが探しているものを与えるはずです。その内容をある種のバッファに格納し、getTextFromPage
の後に、そのバッファを調べて各フォントを見ることができます。そのインタフェースを実装する例を見るには、SimpleTextExtractionStrategy
のコードを参照してください。そうでなければhere's a C# versionあなたが探しているものはかなりです。
こんにちは、お返事ありがとうございました。私は、Javaのコールバック関数の概念(ここでは 'renderText'など)を知らなかった。 "Document Font"のドキュメントに記載されているgetFont()メソッドのオブジェクトにgetFullFontName()を適用してフォント名を取得することができました。 :-) – srjit
- 1. iTextを使用してpdfファイルからデータを抽出する方法
- 2. iTextを使用してpdfを読む
- 3. iTextとPDFライターを使用してpdfファイルにcreationDateを上書きする
- 4. pdf/pdfをiTextライブラリを使用して変換する
- 5. iTextのPDFファイルのリンクを使用してローカルフォルダを開く
- 6. iTextを使用してWebブラウザ内にPDFファイルを表示
- 7. iTextを使用してPDFファイルにフォントを埋め込む
- 8. PDFNetを使用してPDFからURLを取得する
- 9. Perlを使用してPDFからデータを取得する
- 10. Javaを使用してMySqlデータベースからBlob pdfファイルを取得する方法
- 11. Javaストリームを使用してWebからPDFファイルを取得する方法
- 12. androidでiTextを使用してPDFファイルを読むか開きます
- 13. パスなしでitextを使用してPDFを作成する
- 14. iTextを使用したHTMLからPDFへの変換
- 15. AWS S3バケットのpdfファイルをiTextを使用して編集する
- 16. iTextを使用したPDFのHTMLテーブル
- 17. iTextを使用したPDFテキスト抽出
- 18. itextでpdfテンプレートを使用してデータセットをエクスポートするには?
- 19. iTextを使用して静的XFA PDFを記入する
- 20. スクリプトを使用してpdfドキュメントからテキストを取得
- 21. itextsharpを使用してPDFからテキスト段落を取得
- 22. ExcelをPDFに変換する - iTextを使用してJavaを使用する
- 23. フライングソーサー/ iTextのPDFファイル
- 24. ITextまたはITextSharpまたはBouncyCastleを使用してpdfファイルからpkcs7(byte [])を抽出する
- 25. AndroidでiTextを使用してPDFファイルから画像とテキストを順番に抽出する方法
- 26. How To:C#を使用してmysqlにPDFファイルを保存して取得する
- 27. JavaScriptからPDFファイルのフォームデータを取得
- 28. itext 7を使用してPDFに新しいページを追加
- 29. itext 5を使用してPDF文書のコンテンツの長さと幅を取得する方法
- 30. Javaでitext apiを使用してpdfで余分なページ数を取得する
[使用されているすべてのフォントがJava iTextでPDFに埋め込まれていることを確認するには?](http://stackoverflow.com/questions/4646130/how-to-check-that-all-used-fonts- pdf-with-java-itextに埋め込まれています) –