0

ETLカスケードジョブの最後に、Hadoop metricsを使用してElasticsearchの取り込みに関するメトリクスを抽出します。elasticsearch-hadoopはHadoopカウンタを使用して公開します。elasticsearch-sparkからメトリックを取得

私はSparkを使用して同じことをやりたいのですが、Spark connectorを使用している指標に関するドキュメントは見つかりません。

常にそうではありませんが、通常はEMR(Hadoop)でジョブを実行します。Spark connectorは、カスケードコネクタと同じ方法でHadoopを使用しています。とにかく、私はそれがカスケードのような "MapReduceコネクタタイプ"のためだと思うので、そうではないと思います。

だから私の質問は以下のとおりです。

  1. Elasticsearchスパークコネクタからメトリックを抽出する方法は?
  2. コネクタがHadoop Countersを使用している場合、Hadoop YarnでSparkのHadoop Countersにアクセスする方法を教えてください。

バージョン:

  • スカラ基本的2.11.8
  • スパーク2.1
  • のHadoop 2.7.2
  • elasticsearch-火花20_2.11 5.2.2

答えて

関連する問題