2017-04-15 11 views
0

RDDにロードする必要があるスパースcsc_matrixがあります。しかし、RDD サポートなどcsc_matrixの直接ロードされていません。pyspark rddにcsc_matrixをロードする方法

sc.parallelize(my_csc_matrix) 

たちはRDDフレンドリースパースベクトルにcsc_matrixを変換することができます方法はありますか?

答えて

0

あなたが使用してRDDにロードすることができます。

rdd = sc.parallelize(my_csc_matrix.toarray()) 

が、この方法をロードすることによって、あなたは再び高密度アレイにあなたのcsc_matrixを変換してからロードしているが。しかし、とにかく上記のコードを使用してロードすることができます。

関連する問題