2012-02-07 1 views

答えて

3

私は、タスクがやや似ているので、よく発達したストリームログのハングアウトログを解決する方法を探しています。
そうする2つの既存のシステムがあります。
水路:https://github.com/cloudera/flume/wiki
そして
スクリーブ:https://github.com/facebook/scribe

だからあなたのタスクは、唯一のさえずりからデータを取得することになり、私はasumeすると、この問題の一部ではなく、これらのシステムの1つにこのログを供給します。

1

FluentdログコレクタはWebHDFSプラグインをリリースしました。このプラグインにより、ユーザーは即座にデータをHDFSにストリームすることができます。 fluent-plugin-twitterを使用しても

enter image description here

、あなたはそのAPIを呼び出すことによって、Twitterのストリームを収集することができます。もちろん、Fluentdにストリームを投稿するカスタムコレクタを作成することもできます。 Fluentdに対してログを投稿するRubyの例を以下に示します。

関連する問題