私は、KMSクライアント側で暗号化されたDynamoDBのダンプ(つまり、各レコードは独立してKMSクライアント側で暗号化されています)のS3 jsonデータセットを持っています。スパークマップ操作の速度を制限する方法は?
私は各レコードを解読するためにKMSを呼び出さなければならないことを意味するいくつかの分析を実行するために、そのデータセットを読み込むためにSparkを使用したいと思います。各行を単純に復号化するudfを使用しても、KMS APIの制限は100コール/秒に達します。
これらのSparkマップ操作にはいくらかの制限があるのでしょうか?