Spark Streamingの新機能です。ssc.filestream()を使用してJavaのzipディレクトリを処理する方法
特定のディレクトリにあるすべての.zipファイルを監視して解凍します。 は私がhttp://cutler.io/2012/07/hadoop-processing-zip-files-in-mapreduce/を参照して
JavaPairInputDStream<Text, BytesWritable> streamlogFiles=ssc.fileStream(logDir, Text.class, BytesWritable.class, ZipFileInputFormat.class);
は、しかし、私はFILESTREAMは()zipファイルのexsitedinを処理していないことが判明し、次のコードを記述している/指定したディレクトリに移動しました。
私は何かお見逃しですか?