私は、Javaでhadoopを使ってクロス結合を実装しようとしています。結合の両側は十分に大きく、私はそれらのいずれかを記憶できません。私はいくつかのことを試しましたが、PIG/hiveがより簡単かもしれないことに気付きましたが、ネイティブjavaを実装したいと思います。hadoopでのクロス結合の実装
私はCompositeInputFormat
がこれを行う方法かもしれないと思いますが、サンプルコードを見つけることができませんでした。
私は、データを結合するためにReducer
を使用するSequenceFileInputFormat
と疲れにタグ付けされたデータを送信しようとしたが、それはどちらか動作しませんでした。 (これが正しい方法であれば、より詳細な情報を提供できます)。
いくつかのサンプルコードがありますか?
aha!その本の例は私が探していたものです。ありがとう。 –
Oreilly Hadoopの本は素晴らしい学習リソースと参考資料だと思います。 Hadoopを使用している皆さんに強くお勧めします。 –
私は本を手に入れると思います。 –