0
public static Dataset<LabeledPoint> convertRDDStringToLabeledPoint(Dataset<String> data,String delimiter) { 
    Dataset<LabeledPoint> labeledPointData = data.map(
      (data1)->{ 
       String splitter[] = data1.split(delimiter); 
       double[] arr = new double[splitter.length - 1]; 
       IntStream.range(0,arr.length).forEach(i->arr[i]=Double.parseDouble(splitter[i+1])); 
       return new LabeledPoint(Double.parseDouble(splitter[0]), Vectors.dense(arr)); 
      },Encoders.???); 
    return labeledPointData; 
} 

Double、Vectors of Doubleの組み合わせであるLabeledPointDataのエンコーダーを設定する方法。 DataFrameを作成するエンコーダーを設定するには?SparkでRow、LabeledPointDataのエンコーダーを設定するには?

答えて

1

LabeledPointはScalaのケースクラスですので、Encoders.product[LabeledPoint]だと思います。

(私はJavaで記述する方法がわかりません)

関連する問題