0
RDDにロードする必要があるスパースcsc_matrixがあります。しかし、RDD はサポートなどcsc_matrixの直接ロードされていません。pyspark rddにcsc_matrixをロードする方法
sc.parallelize(my_csc_matrix)
たちはRDDフレンドリースパースベクトルにcsc_matrixを変換することができます方法はありますか?
RDDにロードする必要があるスパースcsc_matrixがあります。しかし、RDD はサポートなどcsc_matrixの直接ロードされていません。pyspark rddにcsc_matrixをロードする方法
sc.parallelize(my_csc_matrix)
たちはRDDフレンドリースパースベクトルにcsc_matrixを変換することができます方法はありますか?
あなたが使用してRDDにロードすることができます。
rdd = sc.parallelize(my_csc_matrix.toarray())
が、この方法をロードすることによって、あなたは再び高密度アレイにあなたのcsc_matrixを変換してからロードしているが。しかし、とにかく上記のコードを使用してロードすることができます。