0
私のアプリケーションは、設定されたカフカからトピックを読み込み、変換された結果をHadoop HDFSに書き込むように設定されています。これを行うには、Yarnクラスターノードで起動する必要があります。Spring DataFlowを使用して自律型アプリケーションをデプロイする方法は?
これを実行するには、Spring DataFlowを使用します。しかし、このアプリケーションは別のフローからの入力を必要としないので(ソースをどこで取得するかはすでに分かっています)、何も出力しません。どのようにして有効なDataFlowストリームを作成できますか? つまり、これは1つのアプリケーションだけで構成されるストリームであり、これは糸のノードで無期限に実行する必要があります。
おかげで、とにかく他の選択肢がなかったので、私はそれを動作させるために何をしましたか。トピック名は本当に重要ですか?アプリケーション内ですべてが既に設定されているからです。 Kafkaのポーリングを直接設定するのではなく、シンクを入力として使用するようにアプリケーションの動作を変更する必要がありますか? –
HDFSシンクアプリケーションが 'kafka'ストリームバインダーを使用している限り、変更する必要はありません。トピック名は重要です。データフローを使用している場合は、シンクアプリケーションで何も設定する必要はありません。 –