私は、Spark 1.6で以下のデータフレームを持って、私は以下のようなデータフレームフィルタ内のフィルタ変数を使用したいがエラーを取得。私はこのスパークScalaのデータフレームのエラー
df.where(fil).show
を実行すると
val df = sc.parallelize(Seq(
("None", "a", "b"), ("c", "None", "d"), ("e", "f", "None"), ("g", "h", "i"))).toDF("A", "B", "C")
val fil = """($"A" !== "None") && ($"B" !== "None") && ($"C" !== "None")"""
私はこのエラーを取得しています:
java.lang.RuntimeException: [1.2] failure: identifier expected
($"A" !== "None") && ($"B" !== "None") && ($"C" !== "None")
^
at scala.sys.package$.error(package.scala:27)
at org.apache.spark.sql.catalyst.SqlParser$.parseExpression(SqlParser.scala:49)
at org.apache.spark.sql.DataFrame.where(DataFrame.scala:806)
助けてください。
私はこのヴァルFILを行う=($で&&($ "B" =!= "None")&&($ "C" =!= "None")filはorg.apache.spark.sql.Column型になりますそれは動作しますが、私はそれをorg.apache.spark.sql.Columnに変換する文字列を持っているので、データフレームフィルタで使用できます。お返事をありがとうございます – rubiks