私は最近作成したファイル(毎日dirで作成されたファイル)をHDFS上のディレクトリから取り出して、それ以降の処理のためにその中のデータを読む必要があるScala-Sparkプログラムに取り組んでいます。私の研究から 私はスカラ座を使用して2日古いファイルを取得するためのコードの下に見つけた:HDFS上に存在するファイルの作成日を取得する方法は?
import java.nio.file._
import java.time._
import java.time.temporal.ChronoUnit.DAYS
val isMoreThan2DaysOld = Files.getLastModifiedTime(path).toInstant.plus(2, DAYS) isBefore Instant.now
をしかし、このコードは、HDFS上に存在するファイルでは動作しません。誰でも私に、Scalaを使用してHDFS上に存在するディレクトリから最新の作成ファイルを選択する方法を教えてください。
ラインのためにあなたのパスを指定します。 //quickstart.cloudera:8020/user/cloudera/pigdata ")は、" dirPath "上のファイルのパスが間違っているため、問題があります。 エラー: java.lang.IllegalArgumentExceptionが:間違ったFS:HDFS://quickstart.cloudera:8020 /ユーザー/ Clouderaの/ pigdata、予想:ファイル:/// 私は、ファイルとそれをしようとした場合:///: java.io.FileNotFoundException:ファイルのファイル:/quickstart.cloudera:8020 /ユーザー/ Clouderaの/ pigdataは コア-site.xmlのプロパティを持って存在しません: fs.defaultFS HDFS:// quickstart.cloudera:8020 私はここで何をしていますか? –
Sidhartha