2011-07-22 14 views
2

HadoopでいくつかのPigスクリプトを順番に実行する必要があります。それらは別々に実行する必要があります。助言がありますか?複数のPigスクリプトを順番に実行するにはどうすればよいですか?

更新

我々は1つのJavaクラスから豚のスクリプトを実行しているに向かって作業しているだけで簡単に更新。 Oozieはコメントで言及された可能性です(私たちのニーズにとっては重すぎますが)。私はまた、Cascading(http://www.cascading.org/)のより大きなジョブフローの一部としてPigスクリプトを編成することが可能であると聞きましたが、少しそれを見ました。

答えて

1

実際には、私は大部分の私のPigスクリプトをbashスクリプトでラップしています。あなたは、シェルスクリプトの内部で順次実行を制御できます。

pig myscript1.pig && pig myscript2.pig && pig myscript3.pig

2

のタスクの簡単なシーケンスのために私はおそらく十分であろう提案orangeoctopusどうなったと思います。あなたが一緒にクラブ豚および/またはプレーンバニラのMapReduceのより複雑なワークフローをご希望の場合、あなたはおそらくを見てみなければならないOozie

更新:

あなたは豚0.9を使用している場合は、可能性おそらく、Pythonのような言語で豚を埋め込むことを見てください。 Heres the link

+0

+1 Oozieの言及のために。 –