tabula

0熱

1答えて

このエラーは引き続き発生します。私が働いている - マックシエラを10.8 のPython 3.6.2 タブラ1.0.5 Traceback (most recent call last): File "/Users/Sam/Desktop/mitch test/test.py", line 22, in <module> tabula.convert_into(root.fi

0熱

1答えて

Tabulaはエリア座標でテーブルを抽出します

PDFドキュメントからその座標を指定してテーブルを抽出するオプションがあります。 Windowsユーザーの場合、座標を取得するには、PDFファイルをTabulaのWebページにアップロードし、座標を含むスクリプトをエクスポートして座標をコードに入力する必要があります。 Macユーザーの場合は、プレビューアプリとクロップインスペクタを使用するだけです。私は、Windowsユーザーにこれを提供するサー

0熱

1答えて

Tabulaからファイルを取得するディレクトリを指定する方法Java

私はこのコードをPythonで使用しています。これはサブプロセスモジュールで開き、そこからデータを取得するために使用しますが、ファイルをOCRする方法を理解できません別のディレクトリから。私は完全なファイルパスをファイル名がコード内になければならないディレクトリに置こうとしましたが、そのトリックはしていないようです。 Tabulaでファイルを取得するディレクトリを指定するにはどうすればよいですか？

0熱

1答えて

pdfファイルを読むためのtabuleからのread_pdfエラー..？

Python2について

1熱

1答えて

Tabula-py-pages引数

tabula.convert_into(filename_final, (filename_zero + '.csv'), output_format="csv", pages="all") ページ2を最後まで変換する方法を教えてください。「エリア」は、ページ1からページの残りの部分に変換するために変更されます。私はおかげで、事前にPythonラッパーのタブラ-PYを使

2熱

1答えて

Tabula-pyは右の列を分割していません

私はちょうどPDFからテーブルを抽出するtabula-py（そしてtabula-javaの喜び）を発見しました。私は今、私の仕事のためにpdfテーブルからいくつかのデータを読み込み、それをちょっときれいにするスクリプトをプログラミングしています。私が使用しているpdfは毎日同じフォーマットであり、テーブルは常に特定のエリアにあります。この領域を検出するには、tabula.exeを使用しています。テ

0熱

1答えて

tabulaを使用してデータフレームにPDFテーブルを抽出する方法

PDFファイルの「コンテンツ」ページ（例：2ページ）をテーブルとして抽出し、そのアイテムを追跡するデータフレームと対応する開始ページ番号。いくつかは「Tabula」を使用することを提案しました。私はいくつかの行を試しましたが、read_pdfモジュールを見つけたり、空のデータフレームを取得したりしていないというエラーが出るようです。それがうまくいくように助けてくれてありがとう？ from tabu

0熱

1答えて

は

私はPDFからテーブルデータを欲しいと私は、 java -jar tabula-java.jar -a 301.95,14.85,841.0500000000001,695.25 -t example.pdf しかし、これではは、2つの列のデータは、いくつかの行に混入したテーブルデータを取得するには、コマンドの下を使用していますタブラコマンドラインで座標だから完全なデータを得るための列座標を

0熱

1答えて

Tabulaでコマンドラインで複数のテーブルを抽出するには？

タブラWebインターフェイスでは、座標が異なる複数のテーブルを選択できます。直接コマンドで可能ですか？

0熱

1答えて

TabulaでPDFを抽出した後のテーブルの並べ替え

私はTabulaを使用してPDFからテーブルを抽出しました。それは働いて、マイナス少しきれいになります。最後の問題は私が克服する方法がわからないということです。セルの行が大きすぎると（つまり、ラップされたテキストが含まれている）、Tabulaはそれを2行に分割し、ほとんどすべての情報と2行目上の行の最初のセルのテキストの後半ですが、残りのセルは「なし」です。ここでは一例です： df