どうすればDTOからSpark ML入力データセットのリストのリストを変換できますか?Javaを使用したSpark MLlib分類入力フォーマット
私はDTOがあります
public class MachineLearningDTO implements Serializable {
private double label;
private double[] features;
public MachineLearningDTO() {
}
public MachineLearningDTO(double label, double[] features) {
this.label = label;
this.features = features;
}
public double getLabel() {
return label;
}
public void setLabel(double label) {
this.label = label;
}
public double[] getFeatures() {
return features;
}
public void setFeatures(double[] features) {
this.features = features;
}
}
とコード:コードの実行後、私は
Dataset<MachineLearningDTO> mlInputDataSet = spark.createDataset(mlInputData, Encoders.bean(MachineLearningDTO.class));
LogisticRegression logisticRegression = new LogisticRegression();
LogisticRegressionModel model = logisticRegression.fit(MLUtils.convertMatrixColumnsToML(mlInputDataSet));
を取得していた:
java.lang.IllegalArgumentExceptionが:要求に失敗しました:カラム を機能は[email protected]タイプのものでなければなりません。 ❖ArrayType(DoubleType、false)。
コードでorg.apache.spark.ml.linalg.VectorUDTに変更した場合:次に
VectorUDT vectorUDT = new VectorUDT();
vectorUDT.serialize(Vectors.dense(......));
私は取得しています:
java.lang.UnsupportedOperationExceptionが:推測することはできませんクラスのタイプ org.apache.spark.ml.linalg.VectorUDTはBean準拠ではないため、
org.apache.spark私はまたそれで立ち往生されます場合は、誰かに、考え出した