この大きなサイズのhadoopファイルを読み込む方法は？

この大きなサイズを読み込むにはhadoopファイルをロードしますか？この大きなサイズのhadoopファイルを読み込む方法は？

hadoopからローカルUSBにファイルを読み込む必要があります。

ディレクトリ内の1つのファイルが奇妙で、名前が " - "で、サイズが45Gを超えています。最初にhadoop fs -getを使用してローカルのLinux VMにデータを取得し、次にWinSCPを使用してデータをローカルUSBにロードします。しかし私のローカルLinux VMの容量はわずか19Gです。これを行う方法？

hadoopコマンドを使用して、45Gファイルを小さいファイルに分割することを検討しています。しかし、私はそのようなコマンドを発見していない。

出典

2016-04-15 user89119

USBをVMにマウントするだけです –

次の操作を試みることができる：

hadoop fs -getコマンドを使用して、VMのディスクにすべてのデータを保存します。
split -b 10240K hadoopfile splitflieを使用します。このファイルは10GBごとに分割されます。
各パーツファイルをUSBに移動します。
宛先にはcat splitfile* > hadoopfileを使用して、1つのファイルを結合します。

出典

2016-04-15 21:19:30

この大きなサイズのhadoopファイルを読み込む方法は？

答えて

関連する問題