2017-06-05 9 views
0

私は iTextの使用しています - 私は2つの異なるPDFファイルを読み込み、それらを私は で発見した第一1の場合 をデバッグしている 、PDFからテキストを取得するために>LocationTextExtractionStrategyをテキストは単語 などでレンダリングされpublic void renderText(TextRenderInfo renderInfo)異なるPDFファイルのためのiTextのTextRenderInfo異なる振る舞い

方法:私はいくつかのコンテンツ

でPDFを持っています 口座TYPE次いでA/C:のようなループ内のテキストをレンダリングする

は次にrenderText方法。 BALANCE(I)、次にFIXED DEPOSITS(LINKED)BAL。 (II)今

私は内容のデバッグ2 PDFファイルは、それが文字などをレンダリングだとき、私は持っているコンテンツ:

日の詳細引き出し

、ループ内renderText方法レンダリングのテキスト: D次いで次いでT次いでEなど

私はテキストをどのようにレンダリングするのだろうと思います(言葉で繰り返し、単語群では時間があり、文字で繰り返し繰り返すことを意味します)。

+0

Bhushan、私の答えは*「どのようにテキストをレンダリングするのか」*またはまだ質問がありますか? – mkl

答えて

0

どのようにテキストをレンダリングするのですか(言葉で繰り返し、単語群では時間があり、文字で繰り返すこともあります)。

iText解析フレームワークは、PDFテキスト描画操作の引数に使用されるアトミック文字列を転送します。

したがって、PDFで文字を1文字ずつ入力すると、1文字につきTextRenderInfoという1つのインスタンスが返されます。テキストを単語ごとに描画する場合は、単語ごとに1つのインスタンスが表示されます。

+0

こんにちはmkl、PDFの詳細を見つける方法はありますか?文字や単語ごとにレンダリングを見つけるのに役立つ方法やその他の方法があります。 – Baba

+0

* pdfの詳細を知る方法はありますか?*はい、 'renderText'で取得したものを分析するだけです。 – mkl

関連する問題