2016-04-22 11 views
0

状況

私はウェブサイトをPHPで書いています。phpで書かれた別のプログラムからtabula-javaを呼び出す方法は?

PHPでは、同じWebサイトにアップロードされたpdfファイル内のテキストを抽出することができます。

githubレポを見つけました。

何が問題なのですか?

私はtabulaのmacアプリを試しました。私は、テーブルのデータを変換する前に、pdfの特定のセクションを強調する必要があることに気付きました。

しかし、これは私が達成したいことではありません。バックグラウンドで、必要に応じてタブラを実行したい。私のウェブサイトがファイルのアップロードを受け取り、特定の条件が満たされたら、タブラを何とかサービスとして呼び出して、それを非構造化データにフィードして、テーブル化されたデータを取得したいと考えています。

これを行うにはどうすればよいですか?

答えて

0

1つの方法は、tabula-extractorコマンドラインコマンドをラップして、結果をアプリケーションに戻すことです。

たとえば、Rでは、tabulizerパッケージがこのように動作します。

関連する問題