2017-03-07 14 views
0

特定の色の枠内にあるテキストを取得する方法はありますか? c#を使用してpdfから横の「赤い」枠に存在するすべてのテキストに可能です。私はそれをgoogledしたが、私はとにかくpdfからスタイルフォーマットのテキストを得ることはできなかった。cを使用してpdfからテキストを抽出する方法#

enter image description here

+2

[C#でのPDFからのテキストの抽出](http://stackoverflow.com/questions/2116440/extracting-text-from-pdfs-in-c-sharp) – tretom

+0

残念ながら、あなたがHTMLをやっているようなPDF。私は@ジョーIrbyは最高のソリューションを持っていると思う...サードパーティのオプションを見つける。しかし、それは容易ではありません。 –

+0

OPはすでにPDF処理のためのサードパーティのライブラリ用の質問[tag:pdfbox]をタグ付けしています。私は彼が効果的にPDF Boxを使って自分の仕事を実装する方法を尋ねると思う。 – mkl

答えて

0

答えは残念ながら、簡単ではありません。通常、プログラマがPDFファイルからテキストを解析できるコードを書く必要がある場合、他の人がPDFを操作するために特別に書いたサードパーティのコードライブラリを使用します。 C#の世界では、よく知られたPDF操作ライブラリのオプションがいくつかありますが、使いやすいものは無料ではありません。私は個人的にiTextSharpというライブラリを使って良い結果を得ましたが、それは無料ではありません。

+0

OPはすでに、PDF処理のためのサードパーティのライブラリ用の質問[tag:pdfbox]をタグ付けしています。私は、彼がPDF Boxを使って自分の仕事をどのように実装するのかを真剣に考えていると思います。ライブラリなしではできません。 – mkl

関連する問題