javaとhadoop 1.0.1を使用してMRジョブを開発しました。しかし、EMRはHadoop 0.20までしかサポートしていません。 EMRでHadoop 1.0.1ジョブを実行することは可能ですか、またはEMR hadoopバージョンに準拠するためにライブラリスタックをダウングレードする必要がありますか?Amazon EMDのHadoop 1.0.1ジョブのサポート
3
A
答えて
3
1.0.1の特定のクラスを使用しているかどうかによって異なります。 MapperクラスとReducerクラスのコアクラス(新旧両方のAPIタイプ)は、0.20から1.0.1の間で変更されていません。
hadoop依存関係を0.20.2に変更してMRジョブjarを再構築できます。コンパイルエラーがなければ、かなり近いです(0.20と1.0.1の間にいくつかのバグ修正がありますが、iあなたが大丈夫だろうと想像してください)。
ジョブがコンパイルに失敗し、0.20で使用できない入出力形式(一部のマルチ入力/出力など)と関連する場合は、1.0のHadoopソースをチェックできます。 1(または実際にCloudera 0.20.2のソース)を使用して、欠落しているフォーマットをバックポートしてジョブジャーに追加できるかどうかを確認します。
潜在的な回避策についてのコメントをお寄せいただくための元の質問に編集エラーを再度投稿してください。
関連する問題
- 1. Amazon Cloud上のHadoop
- 2. Hadoopのジョブ設定
- 3. Hadoop DistributedCacheは、hadoopジョブでステータス
- 4. Hadoop:0.20.203のジョブの連鎖
- 5. PHP、RubyのHadoopサポート
- 6. のHadoopのMapReduceは、今私はのHadoopのMapReduceジョブを実行
- 7. Cascalog Hadoopのバージョンのサポート
- 8. 低レベルでベンチマークHadoopジョブ
- 9. PythonのHadoopのストリーミング:ジョブ名に
- 10. Hadoopカウンタの使用 - 複数のジョブ
- 11. ローカルHadoopからAmazon S3へのDistCp
- 12. Amazon UbuntuインスタンスでのHadoop Mutliclusterインストール
- 13. Hadoop MapReduceジョブのデータローカリティをオフにする
- 14. 最高頻度のHadoop MapReduceジョブ
- 15. 開梱のnvidia-ドッカ(1.0.1-1)(1.0.1-1)
- 16. Amazon DynamoDBのSpring統合サポート
- 17. Amazon EC2 Tensorflow GPUのサポート
- 18. 正常にhadoopジョブを殺す方法/ intercept `hadoop job -kill`
- 19. Amazon S3からhadoopにファイルをコピー
- 20. JMXを有効にするHADOOPジョブapi
- 21. ログ(1.0.1)
- 22. Amazon ECSのdockerでの - shm-sizeのサポート
- 23. Hadoopジョブへの入力としてHadoop Sequentilファイルを読み取る方法は?
- 24. Amazon証明書マネージャの.eduドメインのサポート
- 25. Amazon lex chatbotのコンテキスト変数のサポート
- 26. VPCによるAmazon Elasticsearchサービスドメインのサポート
- 27. Hazelcastスケジュールされたジョブ(クォーツのサポート?)
- 28. 個々のhadoopジョブのカウンターとメトリックを集める
- 29. TensorFlow 1.0.1 SavedModelBuilder
- 30. Python/Sikuli 1.0.1カスタムテストランナー