0
長時間実行しているEMRクラスタを使用したい場合は、その後にデータパイプラインがそのクラスタで何かをやっているように設定したいのですが、長時間実行しているEMRクラスタのAWSデータパイプラインの設定
このEMRクラスタにタスクランナーをインストールする必要がありますか?または多分タスクランナーはプレインストールされますか?他にも簡単な方法がありますか?
長時間実行しているEMRクラスタを使用したい場合は、その後にデータパイプラインがそのクラスタで何かをやっているように設定したいのですが、長時間実行しているEMRクラスタのAWSデータパイプラインの設定
このEMRクラスタにタスクランナーをインストールする必要がありますか?または多分タスクランナーはプレインストールされますか?他にも簡単な方法がありますか?
タスクランナーはEMRにあらかじめインストールされていません。手動で構成する必要があります。stepsに従って、タスクランナーをEMRクラスターにインストールしてください。
タスクランナープロセスの開始時に、--workerGroup
の名前を指定します。この名前はこのEMRクラスターのIDになり、データパイプラインアクティビティーのWorkerGroup
フィールドに使用できます。
ブートストラップアクションで行うことはできますか? – lubom
はい、これらの手順をスクリプトとして追加して、ブートストラップアクションに使用できます。 – franklinsijo
これを行うブートストラップを投稿できますか? WAITING_FOR_RUNNERステータスがあります。 – lubom