ローカルのR
環境にあるオブジェクトのメモリ使用量を一覧表示するcode snippetと同様に、Spark接続で使用できるDataFramesのメモリを表示する同様のコマンドがありますか?例えば。 src_tbls(sc)
と似たようなものは、現在はすべてのDataFramesのみを表示しますが、メモリ使用率は表示しません。sparklyrを使用してDataFramesのメモリ使用量を表示する方法は?
0
A
答えて
1
まず、Sparkで使用されるデータ構造はデフォルトでは怠惰だということを覚えておく必要があります。キャッシュされていない限り、データに関連するストレージオーバーヘッドはありません。キャッシュ自体は一時的です - StorageLevel
に応じて、データは破棄される可能性があります。障害の結果として失われるか、ノードが廃止されます。
また、SQLに圧縮されたカラム型ストレージを使用することを覚えておく必要があります。そのため、メモリの使用率はデータの分散の影響を受ける可能性があります。
オペレーティングシステムのメモリ使用量に関心がある場合は、GangliaやMuninのような適切な監視ソリューションを使用してください。
つSparkContext
を使用して、現在のステータスに関する情報にアクセスすることができると述べていること:
sc <- spark_connect(...)
sc %>%
spark_context %>%
invoke("getRDDStorageInfo")
または照会スパークUIによって:
url <- sc %>% spark_context %>% invoke("uiWebUrl") %>% invoke("get")
browseURL(paste(url, "storage", sep="/"))
またはREST API:
app_id <- sc %>% spark_context %>% invoke("applicationId")
httr::GET(paste(
url, "api", "v1", "applications", app_id, "storage", "rdd", sep="/"
))
関連する問題
- 1. Coldfusionページのメモリ使用量を表示
- 2. 私のCプログラムのCPU使用量とメモリ使用量を表示したい
- 3. EASTLを使用してメモリ使用量を追跡する方法は?
- 4. nvidia-smiはメモリ使用量を表示しません
- 5. すべての16 GBメモリを使用したApache、プロセスとメモリ使用量を制限する方法は?
- 6. ipythonとjupyterのメモリ使用量を一覧表示する
- 7. メモリ使用量
- 8. Windowsの詳細メモリ使用量を確認する方法は?
- 9. ビジュアルスタジオ2017(C++)のメモリ使用量を追跡する方法は?
- 10. PysparkとDataframesを使用してElasticsearchインデックスをクエリする方法
- 11. フォアグラウンドサービス用のメモリ使用量
- 12. メモリ使用量からシードを乱数化する方法は?
- 13. BitmapFactory.decodebyteArray()でメモリ使用量を改善する方法は?
- 14. メモリ使用量をプロファイルする方法は?
- 15. pbsジョブが現在使用しているメモリの量を表示
- 16. WMIでプロセスのCPUとメモリ使用量を知る方法は?
- 17. Silverlightメモリ使用量
- 18. CGPDFDocumentCreateWithURLメモリ使用量
- 19. メモリ使用量テスト
- 20. Silverlightメモリ使用量
- 21. RazorEngineメモリ使用量
- 22. Eclipseのメモリ使用量を減らす方法は?
- 23. iOSメモリ使用量は?
- 24. アプリケーションのメモリ使用量を分析する方法
- 25. メモリの使用量を測定する方法
- 26. IISアプリケーションプールのメモリ使用量を取得する方法
- 27. ノードプロセスのCPUとメモリ使用量を制限する方法
- 28. OS X/macOSプロセスのメモリ使用量を取得する方法
- 29. Google Cloud Platform:VMインスタンスのメモリ使用量を監視する方法
- 30. SQL Serverの物理メモリ使用量を削減する方法