2017-02-17 1 views

答えて

0

の値である必要がありDataFrameNaFunctionsオブジェクトを使用してデータセットからNaN値:

例:

Dataset<Row> yourDataSet = sparkSession.createDataFrame(yourJavaRDDCollection, yourSchema); 
Dataset<Row> dfNaNFilter = new DataFrameNaFunctions(yourDataSet); 

// If you want to remove all of them: 
Dataset<Row> nonNaNValues = dfNaNFilter.drop(); 

// If you want to replace them with a numeric value (e.g. 104): 
Dataset<Row> replacedNaNValues = dfNaNFilter.fill(104); 
関連する問題