。
しかし、Amazon Kinesis AnalyticsをS3バケット内の膨大な量のExsistingデータに使用できるかどうかについて、私はジレンマに陥っています。
オーサリングアプリケーションコード
私たちは次のことをお勧めします。
:あなたのSQL文で•を、私たちは、あなたが長い一時間よりも、次の理由からである時間ウィンドウを指定しないことをお勧めします
- アプリケーションを更新したか、またはAmazon Kinesis Analyticsの内部的な理由により、アプリケーションを再起動する必要がある場合、ウィンドウに含まれるすべてのデータをストリーミングデータソースから再度読み取る必要があります。 Amazon Kinesis Analyticsがそのウィンドウの出力を出すまでには時間がかかります。
- アプリケーションを更新したか、またはAmazon Kinesis Analyticsの内部的な理由により、アプリケーションを再起動する必要がある場合、ウィンドウに含まれるすべてのデータをストリーミングデータソースから再度読み取る必要があります。 Amazon Kinesis Analyticsがそのウィンドウの出力を出すまでには時間がかかります。
- Amazon Kinesis Analyticsは、関連するデータを含め、アプリケーションの状態に関連するすべてをその期間維持する必要があります。これにより、重要なAmazon Kinesis Analytics処理ユニットが消費されます。
クエリ
アマゾンキネシスAnalyticsはこの作業のために良いだろうかどうか任意の考え、。
Amazon Athenaは2016年11月に発売されたので、私もそれを見ていきます:https://aws.amazon.com/athena/ – RyanN