私は既存のカフカのトピックとそこから読み取り、HDFSに書き込むflumeエージェントを持っています。私はflumeエージェントを再構成して、既存のセットアップから離れるようにしたい。カフカチャンネルを使用するために、カフカソース、HDFSシンクへのファイルチャンネル。ソースを指定せずにFlumeのカフカチャンネルを使用する方法
これは、カフカチャンネルとHDFSシンク(水蒸気源なし)のみを使用してこれを達成することができると読んでいます(スティックの端が間違っていない限り)。この設定は動作していません。それは箱の上に水路のプロセスを開始さえしていません。
- HDPクイックスタートVM 2.6.3
- 水路バージョン1.5.2
- HDFSディレクトリが
ps -ef | grep flume
存在しない唯一のI一度処理を戻す:私が使用している# Test test.channels = kafka-channel test.sinks = hdfs-sink test.channels.kafka-channel.type = org.apache.flume.channel.kafka.KafkaChannel test.channels.kafka-channel.kafka.bootstrap.servers = localhost:9092 test.channels.kafka-channel.kafka.topic = test test.channels.kafka-channel.parseAsFlumeEvent = false test.sinks.hdfs-sink.channel = kafka-channel test.sinks.hdfs-sink.type = hdfs test.sinks.hdfs-sink.hdfs.path = hdfs://localhost:8082/data/test/
kafka-sourceを追加しましたが、これは正しくないことがあります。これは、トピックに公開されたメッセージに対して無限ループを作成するためです。
カフカチャンネルとHDFSシンクのみを使用することはできますか、またはkafka-sourceを使用する必要がありますが、メッセージの無限ループを防ぐために他の設定を変更する必要がありますか?
Kafka-source
- >kafka-channel
- >HDFS Sink
- これは私にとっては正しいことではありません。
flumeの起動時にどのようなエラーがありますか? – Erms
flumeプロセスはボックスで開始されていないため、flumeログはありません。 Ambariを介してflumeサービスを開始してもエラーメッセージは表示されません。 – darkCode
起動時にどのflumeエラーが発生したかを調べるには、エージェントを手動で起動する必要があります。
'$ bin/flume-ngエージェント-n $エージェント名-c conf -f conf/flume-conf.properties.template' – Erms