私は "n"を作成しようとしていますdataframes
のデータに基づいています。私はcolumn
の整数値をdataframe
にチェックし、列には "n" dataframes
をIntegers
と多く作成するためにSQL文をループしています。Sparkのリストにデータフレームを追加
は、これは私のコードです:私は作成する必要が
val maxvalue = spark.sql("SELECT MAX(column4) as maxval FROM mydata").collect()(0).getInt(0)
for(i <- 0 to maxvalue){
var query = "SELECT column1,colum2,colum3 FROM mydata WHERE column4 = "+ i
val newdataframe = spark.sql(query)
//add dataframe to List
}
「n」はdataframes
が、私はループの前にList
型を宣言し、ための内側に移入する方法がわかりません。
既存dataframe
データタイプ:
// +------------+------------+------------+------------+
// | column1| column2| column3| column4|
// +------------+------------+------------+------------+
// | String| Double| Int| Int|
// +------------+------------+------------+------------+
新しいdataframes
データタイプ:
// +------------+------------+------------+
// | column1| column2| column3|
// +------------+------------+------------+
// | String| Double| Int|
// +------------+------------+------------+
例のデータを追加してください。コードは再現できません。 – mtoto
データフレームデータタイプ – eifersucht