1
Spark Streamingのカスタム受信機でREST APIを使用できますか?スパークストリーミングRESTカスタム受信機
私はそのAPIから非同期に複数の呼び出し/読み取りを行えるようにしようとしており、それにSpark Streamingを使用しています。
Spark Streamingのカスタム受信機でREST APIを使用できますか?スパークストリーミングRESTカスタム受信機
私はそのAPIから非同期に複数の呼び出し/読み取りを行えるようにしようとしており、それにSpark Streamingを使用しています。
カスタムレシーバは、データを非同期で生成するプロセスであればどれでもかまいません。通常、def receive()
メソッドは、Futures
と専用のThreadPool
を使用して、RESTサーバーに非同期要求を送信します。 onCompletion
の場合は、store(data)
メソッドを呼び出して、結果をSpark Streamingジョブに渡します。一言で言えば 、
def onStart()
は=>取り扱い非同期要求応答を管理するプロセスを作成しますdef receive()
=>連続I/Oを行い、store(...)
def onStop()
=>停止を呼び出して結果を報告プロセスを開き、onStart
が作成するものをクリーンアップします。custom receivers docsに例があります。
ありがとうございます!私はいくつかの外部実装(Flumeを探していました)を使用して、Kafkaのようなものにデータを取得し、Spark StreamingアプリのソースとしてKafkaを使用することを考えていましたが、うまく動作するように思えます。 – Eugen