AWS EC2上の7つのm4.2x Red HatインスタンスにHortonworkksデータプラットフォーム(HDP2.4)を導入しました。クラスタにはSparkがあり、クエリ用にTableauに接続してSparkを使用しています。私は質問の速度について尋ねられました、そして、私は質問の速度を見積もる方法がわかりません。どのような要素を考慮する必要がありますか、またはスパーククラスタのクエリ速度を知る直接的な方法はありますか?スパーククラスタのクエリ速度
0
A
答えて
0
私は同じ分析を行っています。 tableauレポートをレンダリングすると速度が遅くなるようです。したがって、スピードを分析するには、TableauをSpark Clusterに接続するログを調べる必要があります。
私たちの場合、それはThrift Server 2であり、ログは次の場所にあります。/var/log/spark/spark-root-org.apache.spark.sql.hive.thriftserver.HiveThriftServer2-<<ip>>.out
ログ名の最後にIPアドレスがあります。
ログを見ると、INFO SparkExecuteStatementOperation: Running query
とクエリが表示されます。ダッシュボードに対して実行されるクエリが多すぎます。
あなたは同じことについて高度な考えを得ることができます。詳細な分析を希望する場合は、Resource Managerの「Thrift Server」のステージをEMR Cluster Detailsページから確認してください。リソースマネージャーでは、クエリにも使用されているコンテナを見ることができます。
また、クエリを実行してSparkで同じことを実行し、その動作を確認することもできます。
関連する問題
- 1. SQLクエリ速度
- 2. SQL:CTEクエリの速度
- 3. 増加クエリの速度
- 4. MYSQLクエリ速度(検索クエリとクエリ)
- 5. スパーククラスタ、自分の
- 6. SQLクエリの品質と速度
- 7. SQL Server 2005 Clustered Indexクエリの速度
- 8. Xpathの実行速度が遅いクエリ
- 9. mysqlのクエリ速度最適化
- 10. 加速度計の速度
- 11. 加速度計停止アニメーション移動クエリ
- 12. SQL:高速累積頻度クエリ(postgres)
- 13. PostgreSQLのSQLクエリでWAL生成速度をクエリする方法
- 14. ファイルアクセス速度とデータベースアクセス速度
- 15. JQueryの速度とJavaScriptの速度
- 16. TFS - 速度レポートのローリング平均速度
- 17. openSSLの速度の精度
- 18. 速度(C#の)
- 19. 速度(SQLAlchemyの)
- 20. マウススクロールホイールの速度
- 21. アルゴリズムの速度
- 22. printf()の速度
- 23. スイフトチェックネットワークの速度
- 24. 時間と高度からの速度と加速度
- 25. データベース速度の最適化(複数のクエリ)
- 26. 高度なMySQLの結合。クエリの高速化
- 27. sqlクエリの速度の問題は、これは通常
- 28. ユーザーのSitecoreクエリ/高速クエリ
- 29. VRAMまたはGPUクロック速度のクエリ量
- 30. リモートODBCクエリの速度を向上させますか?