4
aws s3から寄木細工のデータを読み込む必要があります。私はこのためにAWS SDKを使用している場合、私は次のように入力ストリームを取得することができますAWS s3バケットから寄せ木細工のデータを読み込む
S3Object object = s3Client.getObject(new GetObjectRequest(bucketName, bucketKey));
InputStream inputStream = object.getObjectContent();
しかし、Apacheの寄木細工の読者は、このような唯一のローカルファイルを使用しています。
ParquetReader<Group> reader =
ParquetReader.builder(new GroupReadSupport(), new Path(file.getAbsolutePath()))
.withConf(conf)
.build();
reader.read()
は、だから私はどのように解析された入力ストリームを知りません寄せ木張りのファイル。 たとえば、csvファイルの場合、inputstreamを使用するCSVParserがあります。
私はこの目標のためにsparkを使用する解決策を知っています。このよう :
SparkSession spark = SparkSession
.builder()
.getOrCreate();
Dataset<Row> ds = spark.read().parquet("s3a://bucketName/file.parquet");
しかし、私は火花を使用することはできません。
誰も私にs3から寄木細工のデータを読むための解決策を教えてもらえますか?