0
私は、我々はすべての半分に時間をテーブルをハイブするキネシスからのリアルタイムデータを解析するためのJavaフレームワークを持っているユースケースハイブテーブルからスパークストリーミングが可能ですか?
- を持っています。
- このハイブテーブルにアクセスして、リアルタイムに近い処理を行う必要があります。私はKinesisストリームにアクセスする許可を持っていないので、1時間の遅延はうまくいきます。
- 処理がspark(好ましくはpyspark)で実行されると、新しいkinesysストリームを作成してデータをプッシュする必要があります。
- 次に、Splunkを使用してリアルタイムで近くに引き出します。
質問:誰かがハイブからPythonを使用してスパークストリーミングを行っていますか?私はPOCと実際の仕事をしなければなりません。
ご協力いただければ幸いです。
ありがとうございます!
私は自動的に生成されたログファイルでストリーミングを行いました。 –
あなたは、ローカルでデータを保存する必要がない場合とまったく同じようにsparkを使用できます。プロセスストリームansはsparkからストリームを送信します。 –