私はPython、PyTables、HDF5の初心者です。私は私の問題のためのシンプルで最高のソリューションを探しています。Java、Python、PyTables、HDF5を組み合わせるためのシンプルで効果的なソリューション
問題は次にあります。一方では、私はデータを持つ多くのXMLファイルを持っています。私はこれらのファイルを解析し、反対側のhdf5ファイルにデータを入れたいだけです。後で、私はいくつかの検索条件でこのデータを使用します。なぜHDF5ですか?多くのデータセットを置く必要があるため、速度が必要です。 RDBMSを使用すると、JOIN操作中にパフォーマンスに問題が発生します。解決策は、スピードと良好なメモリ性能を提供しなければならない。
私はPythonとPyTablesの可能な解決策を見つけました。私のアイデアはPyTables APIを使ってhdf5にデータを挿入し、PythonスクリプトをJavaから実行するPythonスクリプトを書いた後、JavaのXML(このコードはJavaで書かれている必要があります)ですから、私はJavaプログラムからPythonスクリプトを作成して実行しています。 JavaでPythonスクリプトを書くために、私はjava.io. * packageを使用していて、JavaでProcessクラスを実行しています。
p.exec:たとえば( "CMD/CのC:\ MyScripts \ myscript.py")
私は知りませんが、このソリューションは良いです。私にとっては、java.io. *を使ってJavaからスクリプトを書くのは面白くない。おそらく、私は後でスクリプトからの結果を読むことで問題を抱えるでしょう(PythonスクリプトとPyTables APIを使っていくつかの検索基準を作るとき)。
私の問題についてはほとんど質問がありません。片側のXMLデータを解析し、反対側のhdf5にデータを格納する最善の解決策は何ですか?私はこの解決策(JavaコードからPythonスクリプトを作成して実行する)を正しく実行していますか? PythonとPyTablesについてはどうですか?これらの技術は私の問題に適していますか?また、私はJythonに関するいくつかのことを読んでいますが、PyTablesと組み合わせることは可能ですか?
専門家の意見やヒントを歓迎します。助けてくれてありがとう。
曖昧さから、なぜXMLコードをJavaで記述する必要がありますか? Pythonには、多くの優れたxmlパース/ライティングライブラリがあります。本当にPyTablesを使いたいのであれば、すべてをPythonに移す方が簡単かもしれません... –
はい、大丈夫です。私はそれについて考えなかったので、Pythonで多くの経験を持っていない。また、私は大きなプロジェクトの小さな部分に取り組んでいます。私はパーソン解析にPythonを使用する権限があるのかどうかはわかりませんが、問題ではないと思います。アドバイスをありがとう。 –