こんにちは私は、ハイブを使用するときにS3をデフォルトのファイルシステムとして使用しようとしています。 私が設定している:私は、データベースを作成することができます// mybucket デフォルトのファイルシステムとしてS3を使用
と:
- fs.defaultFS = S3をテーブルと私のs3のバケツに表示されます。 これらのテーブルを使用しようとすると、問題が発生します。私はエラーを取得する:
Incomplete HDFS URI, no host: hdfs:/tmp/hive/hadoop/dir/filename
問題は、それはまだ代わりにS3のHDFSを使用することで他に何私はハイブとMapReduceのはFSとしてS3を使用するために設定する必要がありますか?
テーブルを読み書きしようとしていますか?もしそうなら、 'CREATE EXTERNAL TABLE'がS3を使用する最良の方法です。または、パスを介して実際のファイルを参照する必要がありますか? –
こんにちはHDFSの代わりにs3バケットを使用したいと思います。分割されていないデータがあるソースバケットから外部テーブルを作成し、パーケットファイルを分割した新しいs3バケットにそのデータを挿入したいと思います。だから、私はMapReduceをS3のメモリとして使用し、HDFSでは使用しないようにしたいと思います。なぜなら、私はそのアプローチで無制限のメモリを持つからです。 –