これを調べましたか? http://pdftohtml.sourceforge.net/
オープンソースでもありますので、無料で、必要に応じて変更することができます。
PDFの前とHTML版のデモがあります。あなたが私に尋ねるならば悪くない。
特にPDFの表に問題がある場合、おそらく問題はテーブルそのものとそれを生成するために使用されているプログラムです。すべてのPDFが均等に作成されるわけではありません。 ALSO
:は、それがテキストの他のブロック/ラインを持っているテキストの/貼り付けブロック/行をコピーするために来るとき、私が作成し、年間で遭遇したすべてのPDFファイルは、問題の多くを持っていることに注意してください任意のページで同じ高さまたはそれ以上の高さで私は、Acrobatには、何のブロックが選択されたか(またはほとんどのプログラムが適切に使用していない)「ブロックのシーケンス順序」を定義する能力がないと考えられるので、システムのソートはトップダウン、左から右へあなたがそれを期待していないときに大きな空白の領域を越えたり、複数の列から線をつかむことを意味しても、コンテンツを選択することはできません。これは、表形式のデータ問題の一部である可能性があります。ここの弱いリンクはPDFフォーマットそのものです。おそらく、あなたはそれからあまりにも多くを期待しているかもしれないと思います。何かをPDFに変換することは、特に編集可能なテキストをたくさん入れ始めると、一方通行の通りです。
そうもあり、返信用のuに感謝しかし、私はそのリンクに見てきたと私はそれから所望の出力を得るcouldntの –
答えのためのハイテクのおかげで、私はする必要がこのPDFを元の構造に変換する[link](http://www.marico.com/html/investor/pdf/Quarterly_Updates/Consolidated%20Financial%20Results%20-%20Q3FY11.pdf) –