3

私はAWS-Kinesis-Firehoseを使用してS3にデータを傷付け、その後Athenaで消費します。AWS Kinesis Firehoseデータをペイロードでs3に分割

Athenaが多くのデータを探索するのを避けるため、異なるゲームのイベントを分析しようとしています。各ゲームの識別子を使用してs3データを分割したいと思いますが、これまでFirehoseは異なるゲーム。

誰でもそれを行う方法を知っていますか?

ありがとう、 Javi。

+0

これまで考えていたコードを追加する方が良いでしょう。 – anyanwu

答えて

1

あなたがメインの消防ホースストリームにトラフィックを送信することができます - そして、複数の消防ホースストリームにデータを分割するためにラムダ関数を使用する - 別のフォルダ/バケット内のデータを保存します各ゲームの1を

+0

私はこれについて考えましたが、問題があります。日常的に2千万回のイベントがあると予想されます。つまり、ラムダ関数は1日20M回トリガーされますイベントを「分類」するだけでは、コストがかかります。 – bracana

+0

私は時間間隔でそれを行うことによって私を助けることができるcloudWatchイベントを見つけましたが、まだ高価かもしれません – bracana

+0

ラムダはFireHose経由で1000イベントまでバッチとしてトリガーすることができます - あなたのトリガーを劇的に減らすでしょう –

2

あなたができましたおそらくAmazon Kinesis Analyticsを使用して、着信FirehoseストリームをゲームIDなどのロジックに基づいて別々の出力ストリームに分割することができます。

KinesisFirehoseInputを受け入れ、KinesisFirehoseOutputにデータを送信できます。

しかし、limits documentationは、アプリケーションごとに出力先が3つしかないことを示唆しているようです。したがって、これでは十分ではありません。

関連する問題