1熱
1答えて
parallelizeメソッドを使用してemptyRDDを作成するのはなぜお勧めしませんか?
0熱
1答えて
0熱
1答えて
RDD.getStorageLevel.useMemoryがtrueを返しますが、Spark UIストレージがキャッシュされたデータを表示しないのはなぜですか?
1熱
1答えて
デフォルトのpersist()は、シリアル化されていないオブジェクトとしてJVMヒープにデータを格納するのはなぜですか?
0熱
1答えて
pysparkのパイプライン化されたRddにアクセスできない
0熱
1答えて
spark foreach(keyValue)、値がメモリの爆発を引き起こすかどうか?
0熱
1答えて
Spark RDDのネイティブなScalaメソッドを使用しても、Sparkの魔法は失われますか?
0熱
1答えて
0熱
2答えて
Pyspark Dataframeは、列から要素のリストとして文字列を持つユニークな要素を取得します。