私はpysparkとhivecontext.sqlを使用しています。私のデータからすべての空値と空値を除外したいと思います。hivecontext.sqlでnull文字列と空の文字列をフィルタリングします。
私は単純なSQLコマンドを使用して最初にNULL値をフィルタリングしましたが、それは機能しません。
マイコード:
hiveContext.sql("select column1 from table where column2 is not null")
が、それは "column2のがNULLでない" という表現せずに
エラー仕事:
Py4JavaError: An error occurred while calling o577.showString
を、私はそれが私の選択によるものだったと思うが間違っています。
データ例:
column 1 | column 2
null | 1
null | 2
1 | 3
2 | 4
null | 2
3 | 8
目的:
column 1 | column 2
1 | 3
2 | 4
3 | 8
TKS