2017-02-12 11 views
0

長時間実行しているEMRクラスタを使用したい場合は、その後にデータパイプラインがそのクラスタで何かをやっているように設定したいのですが、長時間実行しているEMRクラスタのAWSデータパイプラインの設定

このEMRクラスタにタスクランナーをインストールする必要がありますか?または多分タスクランナーはプレインストールされますか?他にも簡単な方法がありますか?

答えて

2

タスクランナーはEMRにあらかじめインストールされていません。手動で構成する必要があります。stepsに従って、タスクランナーをEMRクラスターにインストールしてください。

タスクランナープロセスの開始時に、--workerGroupの名前を指定します。この名前はこのEMRクラスターのIDになり、データパイプラインアクティビティーのWorkerGroupフィールドに使用できます。

+0

ブートストラップアクションで行うことはできますか? – lubom

+0

はい、これらの手順をスクリプトとして追加して、ブートストラップアクションに使用できます。 – franklinsijo

+0

これを行うブートストラップを投稿できますか? WAITING_FOR_RUNNERステータスがあります。 – lubom

関連する問題