にデータ型を変更します。私は、各行の三つの要素を持っていた場合、私は私には私が整数に行を変更したいRDD</p> <pre><code>rdd=sc.parallelize([[True,False,False], [True,True,True], [False,False,True]]) </code></pre> <p>を持っRDD
[[1, 0, 0], [1, 1, 1], [0, 0, 1]]
を与える
def asInt(x):
return [int(x[0]), int(x[1]), int(x[2])]
rdd=rdd.map(asInt)
を使用することができますが、私は数百万行を持っているので、私は別のソリューションを必要としています。私はまた、DataFrameを使用する任意のソリューションを受け入れるだろう。ここ