私の質問はthe pageのコードに基づいています。apacheスパーク理解密度ベクトル
私の一般的な理解は、要素のほとんどが0であり、非常にいくつかの要素がスパースベクトルは、我々が定義する必要がない理由
を圧縮することは容易である0であるとき、密ベクトルを使用する場合は、スパースベクトルが使用されていることです密ベクトルとしてのベクトルの下に?各ベクトルには3つの要素しかないので、密なベクトルの定義はどのように役立ちますか?なぜそれらをベクトルとして参照することはできませんか?
# Prepare training data from a list of (label, features) tuples.
training = sqlContext.createDataFrame([
(1.0, Vectors.dense([0.0, 1.1, 0.1])),
(0.0, Vectors.dense([2.0, 1.0, -1.0])),
(0.0, Vectors.dense([2.0, 1.3, 1.0])),
(1.0, Vectors.dense([0.0, 1.2, -0.5]))], ["label", "features"])
を作成するために、密な方法でmllibベクトル工場でそれらを作成することができます参照として、法線ベクトルに相当しますあなたが求めていることははっきりしていません。どうした ? – eliasah
なぜ、「Vectors.dense」が使われたのかを理解するのに苦労しています。なぜ最初の要素が '(1、([0,1.11,0.1]))'であると言うことができないのでしょうか? – user2543622