HDFSファイルのサイズを調べる方法は? HDFS内のファイルのサイズを調べるには、どのコマンドを使用する必要がありますか。HDFSファイルのサイズを確認する方法
答えて
hadoop fs -ls
コマンドを使用すると、現在のディレクトリ内のファイルとその詳細を一覧表示できます。コマンド出力の5番目の列には、ファイルサイズがバイト単位で格納されます。
コマンドhadoop fs -ls input
は、次のような出力が得られます。ファイルsou
の
Found 1 items
-rw-r--r-- 1 hduser supergroup 45956 2012-07-19 20:57 /user/hduser/input/sou
サイズは45956バイトです。
また、自分自身がhadoop fs -dus <path>
を使用しています。たとえば、「/ユーザ/ frylock /入力」という名前のHDFS上のディレクトリには、100個のファイルが含まれていると、あなたが実行できるこれらのファイルのすべての合計サイズが必要な場合:
hadoop fs -dus /user/frylock/input
を、あなたは合計サイズを取り戻すだろう"/ user/frylock/input"ディレクトリ内のすべてのファイルのサイズ(バイト単位)を指定します。
また、HDFSはデータを冗長に格納するため、ファイルによって使用された実際の物理ストレージは、hadoop fs -ls
とhadoop fs -dus
で報告されているものの3倍以上になる可能性があります。
最後の点に加えて、レプリケーションファクタは許可フラグの後に表示され、所有者(@ adhunavkulkarniの回答の2番目の列)の前の番号です –
hadoop fs -du -s
はるかに読みやすい出力のために 'hadoop fs -du -s -h/user/frylock/input'を使用してください。 – axiom
APIで処理したい場合は、 'getFileStatus()'メソッドを使用できます。
空のファイルでゼロにならないように割り当てられたブロックサイズを返すファイルサイズを返さないのは正しくありません。デフォルトは67108864です。 – user1613360
ファイルサイズを取得するのに役立つ以下の関数を使用しました。
public class GetflStatus
{
public long getflSize(String args) throws IOException, FileNotFoundException
{
Configuration config = new Configuration();
Path path = new Path(args);
FileSystem hdfs = path.getFileSystem(config);
ContentSummary cSummary = hdfs.getContentSummary(path);
long length = cSummary.getLength();
return length;
}
}
これが7906を返したら、そのディレクトリのサイズはどうですか?それはバイト単位かkbs単位ですか? – retiremonk
HDFSでフィルタリングされた出力の(GBで)サイズを確認するには、awkスクリプトで以下のコマンドを参照してください:
hadoop fs -du -s /data/ClientDataNew/**A*** | awk '{s+=$1} END {printf "%.3fGB\n", s/1000000000}'
出力---> 2.089ギガバイト
hadoop fs -du -s /data/ClientDataNew/**B*** | awk '{s+=$1} END {printf "%.3fG\n", s/1000000000}'
出力---> 1.724GB
hadoop fs -du -s /data/ClientDataNew/**C*** | awk '{s+=$1} END {printf "%.3fG\n", s/1000000000}'
出力---> 0.986GB
- 1. 添付ファイルのサイズを確認する
- 2. Linux:ダウンロードせずにftpでファイルのサイズを確認する方法
- 3. JSONでコレクションのサイズとコンテンツを確認する方法は?
- 4. モバイルSafariでiOSキーボードのサイズを確認する方法
- 5. Chromeデベロッパーツールでリクエスト(アップロードコンテンツ)のサイズを確認する方法
- 6. Bash - ファイルがhdfsにアップロードされているかどうかを確認する方法?
- 7. 画像ファイルのウィンドウアイコンの確認方法
- 8. ファイルがPythonのHDFSに存在するか確認してください
- 9. Minix:プロセステーブルのサイズを確認する
- 10. Page.Cacheのサイズを確認するには?
- 11. BLOB列のサイズを確認する
- 12. ウェブページのサイズを確認する
- 13. 画像のサイズを確認する
- 14. SharePointサイト/サイトコレクションのサイズを確認する
- 15. urlの画像サイズを確認する
- 16. PHP - ファイルアップロードのサイズを確認する
- 17. フォルダのサイズを確認する
- 18. 特定のファイルがページをレンダリングする方法を確認する方法
- 19. イベントレシーバでアップロードする前にライブラリドキュメントファイルのサイズを確認する方法
- 20. パスワードを確認する方法cakephpをハッシュで確認する方法
- 21. のOpenCL:GPUに収まるImage3Dの最大サイズを確認する方法
- 22. PDFファイルをアップロードし、2MB以下のサイズを確認します
- 23. Crystal Reportのrptファイルのバージョンを確認する方法は?
- 24. 実行中の関数のファイル名を確認する方法
- 25. Mac AppのRealmファイルの場所を確認する方法
- 26. 2つのファイルの一致を確認する方法
- 27. JList内のファイルの存在を確認する方法
- 28. 入力ファイルのアップロードの重複を確認する方法は?
- 29. hdfsからファイルを読む方法
- 30. Amazon S3バケット内のフォルダのサブフォルダのサイズを確認する方法
どのように人間が判読できる形式でサイズを出力しますか? -ls -lahはここでは機能しません –