tabula

    0

    1答えて

    このエラーは引き続き発生します。私が働いている - マックシエラを10.8 のPython 3.6.2 タブラ1.0.5 Traceback (most recent call last): File "/Users/Sam/Desktop/mitch test/test.py", line 22, in <module> tabula.convert_into(root.fi

    0

    1答えて

    PDFドキュメントからその座標を指定してテーブルを抽出するオプションがあります。 Windowsユーザーの場合、座標を取得するには、PDFファイルをTabulaのWebページにアップロードし、座標を含むスクリプトをエクスポートして座標をコードに入力する必要があります。 Macユーザーの場合は、プレビューアプリとクロップインスペクタを使用するだけです。私は、Windowsユーザーにこれを提供するサー

    0

    1答えて

    私はこのコードをPythonで使用しています。これはサブプロセスモジュールで開き、そこからデータを取得するために使用しますが、ファイルをOCRする方法を理解できません別のディレクトリから。私は完全なファイルパスをファイル名がコード内になければならないディレクトリに置こうとしましたが、そのトリックはしていないようです。 Tabulaでファイルを取得するディレクトリを指定するにはどうすればよいですか?


    1

    1答えて

    tabula.convert_into(filename_final, (filename_zero + '.csv'), output_format="csv", pages="all") ページ2を最後まで変換する方法を教えてください。 「エリア」は、ページ1からページの残りの部分に変換するために変更されます。 私は おかげで、事前にPythonラッパーのタブラ-PYを使

    2

    1答えて

    私はちょうどPDFからテーブルを抽出するtabula-py(そしてtabula-javaの喜び)を発見しました。私は今、私の仕事のためにpdfテーブルからいくつかのデータを読み込み、それをちょっときれいにするスクリプトをプログラミングしています。私が使用しているpdfは毎日同じフォーマットであり、テーブルは常に特定のエリアにあります。この領域を検出するには、tabula.exeを使用しています。テ

    0

    1答えて

    PDFファイルの「コンテンツ」ページ(例:2ページ)をテーブルとして抽出し、そのアイテムを追跡するデータフレームと対応する開始ページ番号。いくつかは「Tabula」を使用することを提案しました。私はいくつかの行を試しましたが、read_pdfモジュールを見つけたり、空のデータフレームを取得したりしていないというエラーが出るようです。それがうまくいくように助けてくれてありがとう? from tabu

    0

    1答えて

    私はPDFからテーブルデータを欲しいと私は、 java -jar tabula-java.jar -a 301.95,14.85,841.0500000000001,695.25 -t example.pdf しかし、これではは、2つの列のデータは、いくつかの行に混入したテーブルデータを取得するには、コマンドの下 を使用していますタブラコマンドラインで座標だから完全なデータを得るための列座標を

    0

    1答えて

    タブラWebインターフェイスでは、座標が異なる複数のテーブルを選択できます。直接コマンドで可能ですか?

    0

    1答えて

    私はTabulaを使用してPDFからテーブルを抽出しました。それは働いて、マイナス少しきれいになります。最後の問題は私が克服する方法がわからないということです。セルの行が大きすぎると(つまり、ラップされたテキストが含まれている)、Tabulaはそれを2行に分割し、ほとんどすべての情報と2行目上の行の最初のセルのテキストの後半ですが、残りのセルは「なし」です。ここで は一例です: df