2017-08-10 7 views
1

私はhdfsコネクタを設定するとき、 "flush.size=3"と "rotate.interval.ms=5000"を設定します。混乱しているのは、 :ファイルの何千もの十...Kafka-connect-hdfs:小さなファイルとrotate.interval設定の違い

files

私はより多くのささいなファイルにしたくない、他の可能な解決策はありますか?

さらに、rotate.interval.msrotate.schedule.interval.msの違いは何ですか?

答えて

0

設定値rotate.interval.ms=5000は、5秒ごとにファイルコミットを呼び出します。データ取り込み率が低く、コネクターがファイルをコミットするのに十分なメッセージを書き込んでいない限り、デフォルトでは無効にしておきます。

はrotate.interval.msとrotate.schedule.interval.msの違いがあることである:

rotate.schedule.interval.msは必ずコミットに関係なく、以前のcommits.This構成の 予定時刻に行われますようになります便利 です現在のサーバー時間に基づいてデータをコミットする必要がある場合は、 が毎時のようになります。

rotate.interval.msは、 'n' msごとにファイルをコミットし、ファイルコミットが 'n' msごとに確実に呼び出されるようにします。

+0

ありがとうございました! ファイルをコミットするたびに新しいファイルが生成されますか? rotate.interval.msとrotate.schedule.interval.msの設定を無効にすると、コネクタがファイルをコミットするまでの時間はどのくらいですか?これはメモリサイズと関係がありますか? – lcplj123

関連する問題