私のクラスタの "/ user"ディレクトリにあるすべてのHDFSファイルから最初の行を取得しようとしています。ディレクトリ内のすべてのHDFSファイルから最初の行を取得する方法はありますか?
現在、所有者、完全なパス(場所)、所有者の企業ID、ファイルの作成日、ファイルの読み書き権限など、これらのファイルに関する情報を含むHiveテーブルがあります。新しい列を追加したいファイルの完全な最初の行を含むこのHiveテーブルに追加します。
だからこそ私はディレクトリ(私の場合は "/ user"ディレクトリ)内のすべてのHDFSファイルの最初の行を抽出する方法を探しています。私はこれを達成することはできますか?
hadoop fs -cat /user/* | head
と遊ぶ:
これは私のために働いた!ありがとう@恋人 – PreethiS