私はKafka ConnectやSecorのようなサービスを使用して、ParquetファイルをS3に保存しています。私はHDFSやHadoopに慣れていませんが、これらのサービスは通常、s3にバルク書込みを行う前に一時ファイルをローカルメモリまたはディスクに書き込むように見えます。 s3n/s3aファイルシステムは、HDFS形式のファイルシステムをローカルで仮想化し、設定された間隔でプッシュするか、s3n/s3aへの書き込みとs3への書き込みとの間に1対1の対応がありますか?s3n/s3aはどのようにファイルを管理しますか?
ここで正しい質問をしているかどうかは完全にわかりません。どんな指導も高く評価されます。