0
自分のデータセットでランダムフォレスト分類モデルを実行しています。 spark1.6によって提供されたoneHotEncodeメソッドを使用して、それらを扱ういくつかのカテゴリ変数があります。最後に、私は多くのスパースベクトルspark-1.6のカテゴリ変数を扱う方法は?
私のコードを得た:
def oneHotEncode(a: String,b:String,c:String,selectedData:DataFrame) :
DataFrame = {
val indexer = new StringIndexer().setInputCol(a).setOutputCol(b).fit(selectedData)
val indexed = indexer.transform(selectedData)
val encoder = new OneHotEncoder().setInputCol(b).setOutputCol(c)
val encoded = encoder.transform(indexed)
return encoded
}
var data1 = oneHotEncode("ispromoteroom","ispromoteroomIndex","ispromoteroomVec",selectedData)
質問は、私がLabeledPointデータ型に設定されたデータでそれらのスパースベクトルおよび他のオリジナル連続変数を変換することができる方法ですか?