Big Dataの初心者ですから、Hadoopのログファイルからデータを視覚化するためのダッシュボードアプリケーションを構築する方法はわかりません。周りに検索した後、私はいくつかの解決策を考えることができます:Hadoopからログファイルを視覚化する方法は?
1 /ストリーミングデータ
を摂取するカフカを使用して2 /ストリームデータ処理:ストリーミングスパークまたはApache FLINK
3 /フロントエンド - >データを視覚化する:d3jsを使用
私に何かが不足していますか?私が使用すべきスパークとフリンク? 私は、Ambari、HDP 2.4.2、HDFS 2.7、YARN 2.7、Spark 1.6、Kafkaをインストールしました。
可能であれば、そのようなアプリケーションを作成するためのチュートリアルを教えてもらえますか?どの本やコース?
ありがとうございました。
P/s:
私はdatabrickのgitの本を読んだことがありますが、それは唯一のスパークと言われています。私はFlink、Elasticsearch、Kibanaを使って分析する方法をいくつか教えていますが、Ambari Serverと組み合わせる方法については触れていません。
シンプルなGoogle検索では、いくつかの参考になる可能性があります。https://databricks.gitbooks.io/databricks-spark-reference-applications/content/logs_analyzer/これは、ELKスタックが最もよく答えるタスクのようですが、可視化のために[Kibana](https://www.elastic.co/products/kibana)をチェックし、[stack](https://www.elastic.co/製品)を提供します。しかし、あなたはあなたのニーズを説明していないので、それ以上のことはできません。任意の技術を選択する前に、要件について考える必要があります。 –
私はdatabrickのgitの本を読んだが、それは火花だけ言及している。また、Flink、Elasticsearch、Kibanaを使って分析する方法についてもいくつかチュートリアルがありますが、Ambari Serverとどのように結合するかについては言及していません。 – hminle
これまでに見つかった内容と要件を説明し、それはアンバリのコミュニティに向かっています。 –