2016-07-07 13 views
0

Big Dataの初心者ですから、Hadoopのログファイルからデータを視覚化するためのダッシュボードアプリケーションを構築する方法はわかりません。周りに検索した後、私はいくつかの解決策を考えることができます:Hadoopからログファイルを視覚化する方法は?

1 /ストリーミングデータ

を摂取するカフカを使用して

2 /ストリームデータ処理:ストリーミングスパークまたはApache FLINK

3 /フロントエンド - >データを視覚化する:d3jsを使用

私に何かが不足していますか?私が使用すべきスパークとフリンク? 私は、Ambari、HDP 2.4.2、HDFS 2.7、YARN 2.7、Spark 1.6、Kafkaをインストールしました。

可能であれば、そのようなアプリケーションを作成するためのチュートリアルを教えてもらえますか?どの本やコース?

ありがとうございました。

P/s:
私はdatabrickのgitの本を読んだことがありますが、それは唯一のスパークと言われています。私はFlink、Elasticsearch、Kibanaを使って分析する方法をいくつか教えていますが、Ambari Serverと組み合わせる方法については触れていません。

+0

シンプルなGoogle検索では、いくつかの参考になる可能性があります。https://databricks.gitbooks.io/databricks-spark-reference-applications/content/logs_analyzer/これは、ELKスタックが最もよく答えるタスクのようですが、可視化のために[Kibana](https://www.elastic.co/products/kibana)をチェックし、[stack](https://www.elastic.co/製品)を提供します。しかし、あなたはあなたのニーズを説明していないので、それ以上のことはできません。任意の技術を選択する前に、要件について考える必要があります。 –

+0

私はdatabrickのgitの本を読んだが、それは火花だけ言及している。また、Flink、Elasticsearch、Kibanaを使って分析する方法についてもいくつかチュートリアルがありますが、Ambari Serverとどのように結合するかについては言及していません。 – hminle

+0

これまでに見つかった内容と要件を説明し、それはアンバリのコミュニティに向かっています。 –

答えて

関連する問題