2017-02-13 3 views
0

私はツェッペリンで次のコマンドを実行しようとしています。同様のコードをScalaでも実行しようとしていますが、うまくいきません。スパークSQLまたはコマンド返さない結果

df.where(df("duration").===(1) || df("duration").===(2)).limit(10) 

すべてのデータフレームを照会して結合するだけのものを書くことができますが、パフォーマンスが心配です。何か案は?

+0

。スカラのバージョンが動作するかどうかは不明です。それがうまくいけば、あなたはスカラーの文字列を比較しているように見えますが、SQLではintです。スキーマとは何ですか? – ImDarrenG

+0

申し訳ありません、スキーマを投稿することはできませんでした、私は私が投稿を検索していた値を変更する必要がありました。 Nietherの仕事と、そこにはいけないスカラのバージョンを無視する – user3920235

答えて

0

あなたはISIN機能を試すことができます:(。DF( "期間")ISIN( "1"、 "2"))

df.whereリミット(10)

val df = Seq(30,1,2,3,4,5,6).toDF("duration") 


val df1 = df.where(df("duration").isin("1","2")) 
df1.show() 


-----------------+ 
|duration   | 
+-----------------+ 
|    1| 
|    2| 
+-----------------+ 
関連する問題