itextsharp(バージョン:5.5.1.0)を使用してpdfファイルを解析しようとしています。 pdfファイルのcontent-typeは "application/octet-stream"です。私は「代わりのような不完全な言葉を得る私はRenderInfo.GetText(それを読んで):私は、PDFファイルの画像をiText PDF PArserはオクテットストリームでデータ全体を解析しません
場所戦略に基づいて読み取るために問題をbase.RenderText(renderInfo);
//Get the bounding box for the chunk of text
var bottomLeft = renderInfo.GetDescentLine().GetStartPoint();
var topRight = renderInfo.GetAscentLine().GetEndPoint();
//Create a rectangle from it
var rect = new Rectangle(
bottomLeft[Vector.I1],
bottomLeft[Vector.I2],
topRight[Vector.I1],
topRight[Vector.I2]);
var word = renderInfo.GetText().Trim();
// get column no
var position = (int)rect.Left;
をC#コードを使用しています毎日 "次のループで" Dai "と" ly "を取得します。私が一言一言一言読むことができる方法はありますか?
詳細情報が必要な場合は教えてください。残念ながら、ここにPDFファイルを添付するオプションはありません。よろしく プラディープ・ジェイン
返信いただきありがとうございます。私は最初にcsvに変換してからcsvファイルを読むという別のオプションを選択する必要がありました。私はあなたの選択肢を調べて、私が言葉全体の単語を得るかどうかを見ます。 –