約200万レコードを持つamazon S3にファイルがあります。今はスレッドを使ってこれらのレコードを処理したいので、処理を素早く行うことができます。私は、これがスパークまたはマップリダクションを使用して実行できることを知っています。しかし、スパークやMRを使用することはできません。行数に基づいてs3オブジェクトを分割する方法
現在、私はJavaでそれを行う方法上の任意の提案は大きな助けになるだろう
for (S3ObjectSummary objectSummary : objectListing.getObjectSummaries()) {
S3Object s3object = s3Client
.getObject(new GetObjectRequest(s3Conn.getBucket(), objectSummary.getKey()));
BufferedReader reader = new BufferedReader(new InputStreamReader(s3object.getObjectContent()));
List<Events> ingEvents = new LinkedList<>();
while ((fileLine = reader.readLine()) != null) {
//Processing the line
}
}
を次のようでしたしています。前もって感謝します。乾杯!
Javaコアでファイルを1行ずつ読み込みますか? –
何のための提案ですか?ファイルを処理したい以外のものは、実際に私たちに言いませんでした。 –
@JaySmith申し訳ありませんが、私はJavaを使いたいと言いました。はい、私はJavaを使用して、行単位でS3スレッドを使用してファイルを読み込みたいと思います。 –