2009-04-08 4 views
0

データベースの更新を月に数回自動化する必要があります。調理されたXML/PDF入力からバックエンドデータベースを更新する:どのツールが最適ですか?

私の現在の使用例は次のとおりです。

現在、前月の 入力で入力データを手動で比較しています。 XMLの場合はMS xmldiffを使用します。それがPdfの場合は、 を完全に実行します.-(。

変更が見つかったら、フォームインターフェイスを使用してデータベースを更新します(再度手動で)。エントリまたはこの全体のプロセスは時間がかかり、個々の人のための非常に退屈でイライラマニュアル ないと言及もあるので、我々は可能な限り、このプロセスを自動化する方法を 探しています。古いエントリを削除する。

我々はあります現在はスクリプトの 言語(特にPython)を使ってすべてを実装しようとしていますが、実際には誰も持っていません。 スクリプト言語の経験があるので、私たちは基本的に私たちが行くにつれて学ばなければなりません。

私たちがジャンプする前に、私たちが答えたい質問が

1ですが)スクリプト言語で正しいアプローチ起こっていますか?私たちは、複数の分野(XML diff、 データベース接続、XML作成など)があるので、スクリプティング 言語が優れていると考えました。他の選択肢 やツールはありますか?

2)他の言語と同じようにPythonを使用していますか?我々は グーグルに基づいて、pythonは成熟しているようであり、ライブラリを通じてすべての種類のデータベース の接続をサポートしています。 調査する必要がある他の選択肢はありますか?(誰も単一のPythonコードを書いていません)

3)pdfファイルで動作する優れたDiffツールはありますか? 特定のテーブルまたは 見出しの内容がpdfで変更され、出力をダンプするかどうかを確認できるものを探しています。

データベースはMSアクセスのみです。

お時間をいただきありがとうございます。

答えて

1

私はPythonが言語を学ぶのは簡単だと思っています。あなたがVBScriptの経験を持っていれば、私の意見ではすぐにそれを拾うことができます。

XML/HTMLの解析にBeautifulSoupを使用しましたが、これは非常に使いやすいことがわかりました。 http://www.crummy.com/software/BeautifulSoup/documentation.html

は、PDFのもののためには、(私が使用していない)rportlabツールキットを見 http://www.reportlab.org/

+0

感謝を取ることができます。リンクを試してみましょう。このようなシナリオでは、スクリプトベースのアプローチが最適です。 – user88595