私はPDFファイルからいくつかのテーブルを抽出しようとしていますが、両方のツール(AbbyyとOmnipage)はテーブルを識別するのに非常に役立ちます。しかし、行と列を特定することについては、どちらも同じ誤りを犯します。PDFをOmnipageまたはAbbyy Finereaderを使用してExcelに変換する際に、個々のセルを分割するのを止める方法はありますか?
通常、問題は部分的な行を作成し、1つのセルだけを水平に分割し、他のセルは分割しない場合に発生します。私の言いたいことの例は添付の画像を見てください。左側の列では、セルの一部が半分に分割されているため、Excelでテーブルを操作するのが難しくなります。
分割されたセルを持つテーブルは常に痛みを伴うので、これらのプログラムが最初にこれを行うのは奇妙です。
個々のセルを分割しないで、完全な列と行のみを設定するようにこれらのプログラムに指示する方法はありますか?
他のソリューションについてのご意見はありますか?
OCRをアプリケーションから自動化しようとしているのですか、またはエンドユーザーアプリケーションを探していますか?後者の場合は、スタックエクスチェンジでより良いはずです –