0
PDFファイルから表データの抽出を自動化しています。私はTabulaと呼ばれるオープンソースライブラリを使用する必要があります。このツールには、列を別の表形式のPDFデータにフィードするオプションが用意されています。Tabula/PDFカラムユニット
-c 80, 250, 380
上記は5つの列を作成します。 80,250,380はカラムセパレータの単位です。
80,250,380の単位は何ですか、どのようにページ上のどの水平位置が何番であるかを知ることができますか?これらの点でPDFが測定される共通の単位はありますか?
あなたはそのコードを使用して測定したときに何が起こったでしょうか? – usr2564301
pdfページの中央に300と書かれているようです。 – HoosierCoder
私が見つけたベストは、実際のアクロバットの定規とこれらの数字との間に作成した比率ですが、これらは何かのために立つ必要があります。 – HoosierCoder