2016-07-19 2 views
2

これは本当に問題のある質問です。申し訳ありません。スパークでは、次のように選択して使用できます。Spark SQL - すべてのAND計算列を選択しますか?

df.select("*"); //to select everything 
df.select(df.col("colname")[, df.col("colname")]); //to select one or more columns 
df.select(df.col("colname"), df.col("colname").plus(1)) //to select a column and a calculated column 

しかし、計算したすべての列を選択するにはどうすればよいですか?明らかに select("*", df.col("colname").plus(1))は動作しません(コンパイルエラー)。これはどのようにJAVAの下で行うことができますか? ありがとうございました!

答えて

4

ちょうど行います

df.select(df.col("*"), df.col("colName").plus(1)); 
+0

pysparkを使用してインポートコ: 'pyspark.sql.functionsから、私は個人的にこれを好む – hamed

0

あなたはwithColumn()メソッドを使用することができ、これは、データフレームに新しい列を作成します。

df.select("*") 
    .withColumn("ColName", col("colName").plus(1)) 
+0

col'インポートします。私の計算された列をすべて一緒にします。 – absmiths

関連する問題