データパイプラインでスパークジョブ用のJarファイルを実行しようとしていますが、EMRステップで正確に何を渡す必要があるのかよくわかりません。スパークジョブのデータパイプラインを使用したEMRアクティビティ
1
A
答えて
1
EMRステップは、どのようにスパークジャーを提出したいかを記述する場所です。
新しいデータパイプラインを作成するときは、[テンプレートを使用してビルド]オプションを選択し、[弾性MapReduceクラスタでジョブを実行]を選択できます。
EmrActivityでは、送信するステップを説明する必要があります(必要に応じて複数のステップを実行することもできます)。
あなたはこのステップを理解するためにAWS EMR Spark Step Guideを読むことができます。要するに、火花の仕事を提出する方法を記述する場所。
いくつかのあいまいな理由のために、データパイプラインでは、スペースをステップの '、'に置き換える必要があります。ここで私はdatapipelineに走ったスパークステップの一例である:
command-runner.jar,spark-submit,--deploy-mode,cluster,--class,com.exelate.main.App,--master,yarn-cluster,--name,<spark job name>,--num-executors,1000,--driver-cores,2,--driver-memory,10g,--executor-memory,16g,--executor-cores,4,<jar location on s3>,<jar arguments>
それらを使用する場所あなたが理解できるように、私は私の設定の一部を残して、あなたは切り替えることができるように、私は<「テキスト」>とのいくつかを置き換えますあなた自身の情報で
関連する問題
- 1. EMRアクティビティでデータパイプラインが失敗する
- 2. AWSデータパイプラインを使用してAWS EMRクラスターで複数の並列スパークジョブを実行する方法
- 3. awsデータパイプラインでemrアクティビティが失敗した場合にシェルコマンドを実行
- 4. aws-cliからのEMRスパークジョブ
- 5. AWSデータパイプラインemrアクティビティステップセクションでカンマをエスケープする
- 6. AWSデータパイプラインとEMRによるDynamoDBバックアップ
- 7. データパイプラインを使用したAWS EFSバックアップ
- 8. シェルスクリプトファイルを使用したスパークジョブの送信
- 9. awsデータパイプラインとEMRでデルタファイルのみを処理する方法
- 10. EMRでスパークジョブを実行しているときにIllegalAccessError
- 11. AWS EMR EMRを使用してjupyterパスワード
- 12. AWSデータパイプラインでEMRクラスターを起動する方法パイプラインフローでのアクティビティの完了後のみ
- 13. AWSデータパイプライン - EMR作成時のHiveサイト値の設定
- 14. AWSデータパイプラインの使用PigActivity
- 15. PowerShell Cmdletを使用したAWS EMRジョブ
- 16. ラムダからEMRでスパークジョブを同時に送信
- 17. JenkinsからEMR糸クラスターにスパークジョブを導入するには?
- 18. 長時間実行しているEMRクラスタのAWSデータパイプラインの設定
- 19. Apache-Sparkを使用したRedshiftへのMongoDBデータパイプライン
- 20. ユーザーインターフェイスを使用してスパークジョブを送信
- 21. アクティビティを使用したページナビゲーション
- 22. スパークジョブでのJavaヒープの使用
- 23. スパークジョブのメモリ使用量のモニタ
- 24. AWS EMRのブタを使用したJavaヒープスペース
- 25. Hive、S3、EMR、およびRecover Partitionを使用したデータのロード
- 26. EMRにスパークジョブを送信するときにファイルが見つかりません
- 27. AWSデータパイプラインを使用してS3ファイルを削除する
- 28. serverless.ymlを使用してAWSデータパイプラインを設定する方法は?
- 29. PostgreSQLを使用したAmazon EMR: "metastore_db"データベースの起動に失敗しました
- 30. ShellCommandActivity(AWSデータパイプライン)でデータパイプラインを使用してSQL Serverでストアドプロシージャを呼び出す方法
ありがとう!それは私たちのデータパイプラインのための執筆ステップを助けました。私たちは実際にいくつかの問題を抱えていましたが、私たちのEMRスパークのインスタンスは私たちの仕事に適合しませんでした。それはしばらくかかりましたが、私たちはそれを理解することができました。 –