私の仕事は、IBM Watsonを使用して、PDFをテキスト・ファイル、または自分のタスクに役立つ出力に変換することです。IBM Watson Document Converterを使用してPDFを解析する
このPDFは、お客様が作成したさまざまな形式の注文書です。顧客は、これらの購買発注を希望どおりに作成することができ、それらを解析する必要があります。
私はドキュメントコンバータをデフォルト設定で使用しようとしましたが、出力はすべての場所にあります。
これにアプローチするアドバイスは、おそらくIBMワトソン・インテリジェンスを使用して、定義されていない場合でも、これらの注文書で必要な情報を見つけ出すための道に沿ったものです。
ありがとうございました。
これに追加するだけです。あなたがPDFで見るものは、常にコンピュータに表示されるものではありません。テキストは順不同で保存することも、グラフィック(スクリーンショット)を表示することもできますが、基礎となるテキストは見た目に関連しません。テストする最も簡単な方法は、テキストをテキストエディタにコピー/ペーストし、その結果を確認することです。それが完璧でない場合、変換ははるかに良くなる可能性は低いです。 –