2016-12-01 3 views
0

私のアプリケーションは、設定されたカフカからトピックを読み込み、変換された結果をHadoop HDFSに書き込むように設定されています。これを行うには、Yarnクラスターノードで起動する必要があります。Spring DataFlowを使用して自律型アプリケーションをデプロイする方法は?

これを実行するには、Spring DataFlowを使用します。しかし、このアプリケーションは別のフローからの入力を必要としないので(ソースをどこで取得するかはすでに分かっています)、何も出力しません。どのようにして有効なDataFlowストリームを作成できますか? つまり、これは1つのアプリケーションだけで構成されるストリームであり、これは糸のノードで無期限に実行する必要があります。

答えて

1

この場合、カフカの名前付きの宛先に接続してHDFSに書き込むストリーム定義が必要です。

例えば、ストリームは次のようになります。

stream create a1 --definition ":myKafkaTopic > hdfs"

あなたはこの詳細はhereを読むことができます。

+0

おかげで、とにかく他の選択肢がなかったので、私はそれを動作させるために何をしましたか。トピック名は本当に重要ですか?アプリケーション内ですべてが既に設定されているからです。 Kafkaのポーリングを直接設定するのではなく、シンクを入力として使用するようにアプリケーションの動作を変更する必要がありますか? –

+0

HDFSシンクアプリケーションが 'kafka'ストリームバインダーを使用している限り、変更する必要はありません。トピック名は重要です。データフローを使用している場合は、シンクアプリケーションで何も設定する必要はありません。 –

関連する問題