2017-12-16 5 views
-2

私はJavaで書かれたプログラムを持っています。このプログラムは、データベースからデータを読み取り、各レコードを分析し、その結果を再度データベースに書き込む。 JavaでスパークのAPIでコードを書き直そうとしていますが、各レコードの解析の一部はPythonコードで行われています。私の質問は、どのようにJava SparkのAPIの下で書かれたJavaコードで私のPythonオブジェクトを呼び出すことができますか?つまり、JavaのSparkのAPIの下ですべてのレコードのpythonオブジェクトを初期化しないようにするために、データベースレコードを解析するためにPythonクラスからオブジェクトを1回だけ作成します。 おかげどのように私はPythonクラスからオブジェクトを作成し、sparkのAPIの下で書かれたJavaプログラムで使用することができます

+0

いくつか例を挙げて、質問を絞り込んでください。 – vinS

+0

私は何とかJava出力コード(Java RDD)をPythonコードに渡す必要があります。またはJavaコードでPythonクラスのオブジェクトを作成してデータベースレコードを分析します。 –

答えて

0

いくつかのオプション:Javaへ

  1. 移行Pythonコードとすることができます、Pythonオブジェクトの対応するJavaオブジェクトを作成するにはシステム()関数
  2. を使用してPythonの実行ファイルを起動します
  3. それを使用シリアライゼーションに依存します。
+0

Pythonコードを呼び出す方法どうすればPythonクラスからオブジェクトを作成できますか?私はJava SparkのAPIの下でJavaとPythonのコードの間にリンクを作成する必要があることを意味します。 –

+0

@ A.Maniは3番目のオプションを追加しました – Steephen

+0

シリアル化に慣れていないので、感謝万円 –

関連する問題