pdf-to-html

    0

    4答えて

    私はpdf、docx、docファイルをPHPを使ってHTMLコードに変換したいと思います。 pdfと同じスタイルです。私は適切な解決策を得ていない。 Config::set('pdftohtml.bin', 'C:/poppler-0.37/bin/pdftohtml.exe'); // change pdfinfo bin location

    0

    1答えて

    私は、複雑な(表、図)と非常に長いpdfをhtmlに変換するためにpdfminerを使用しました。結果をさらに解析したい(たとえば、テーブルや段落を抽出するなど)、nltkのsentence tokenizerを使用してさらに分析を行いたいとします。この目的のために、私は解析を行う方法を理解するために、HTMLファイルをテキストファイルに保存します。残念ながら、私のコードは、TXTにHTMLを書き

    2

    3答えて

    PDFドキュメントをJavaの単一のHTMLファイルに変換しようとしています。ほとんどのコンバーターは、1つのPDFファイルを複数のHTMLファイルに変換します。 PDF全体を1つのHTMLファイルに変換したい。 提案がありますか?

    -2

    1答えて

    テーブルのみを含むPDFファイルを同等のXML形式に変換するにはどうすればよいですか?

    0

    2答えて

    JavaScriptを使用してPDFのページを水平スクロールする方法がわかりました。 PDFのページをHTMLファイルに変換してから、iframe間で左右をクリックします(src = "...各page.html")。 PDFのページをiframe以外のHTML要素(例:DIV?)に変換し、各ページの内容を含む要素の間を左右にクリックします。 私はPDFのテキストが検索可能であることを保証したいの

    1

    1答えて

    複数のファイルまたはpdfファイルを含むフォルダで、どのようにpdf2htmlEXを使用しますか? 私は単一のファイルをうまく変換できますが、明らかに100個のファイルに対して100回コマンドを実行したくありません。 ドキュメントに何も見つかりませんでした。「* .pdf」のようなものは動作しません。 ありがとうございます!

    2

    1答えて

    現在、Apache Webサーバーを実行するリモートのCentOS 5.6システムでsshを使用しています。私はポップラーpdftohtmlバイナリを使用する必要があります。残念ながら、そのマシンには現在インストールされていません。そこで、私はpopplerパッケージをダウンロードし、それを私のuserフォルダの下に作りました。 IIは、システム管理者はないですので、私は make install

    0

    2答えて

    私はabcpdfを使ってpdf文書を対応するhtml文書に変換する方法を探しています。もしそれが実現可能であれば、私に知らせてください。参考までに、私のpdf文書には画像とともにリッチテキストがあります。