2011-12-07 10 views
0

PDFをHTMLに変換する方法はありますか?ファイルからテキストが必要です.PDFtoTextライブラリを試してみましたが、テキストは取得されましたが、ソートされていないため、解析のルールはありません。 私は、PDFtoHTMLオンラインサービスの中には、このファイルでうまくいくものがあることに気づきました。だから、どんなヒントをお願いしますか? Here is the PDF fileとし、右側の列には特定の行が1つだけ必要です。特定のPDFファイルをPHPのHTMLに変換する

+0

http://stackoverflow.com/questions/956508/convert-pdf-to-html –

+0

この回答をお試しください:http://stackoverflow.com/a/ 2249962/765854あなたが気にしている部分だけを取ります。 –

答えて

0

PDFtoHTMLとpopplerプロジェクトを統合してみましょう。テーブル認識をサポートする必要があります。

0

pdftohtmlは高速で安定していますが、html結果は最高です。私は多くの仕事の履歴書を持っているウェブサイトのためにかなりの時間それを使用しています。

ただし、テキストコンテンツの抽出には適しています。

私はScribdのAPIが

http://www.scribd.com/developers/api

またはGoogle AppsのドキュメントAPIを試してみるだろう。 googleは偉大な仕事を表示し、pdfファイルを変換する

+0

出典:stackoverflow.com/questions/956508/convert-pdf-to-html –

関連する問題