if(df.count()== 0){
System.out.println("df is an empty dataframe");
}
上記は、NULLポインタ例外 を取得せずにDataFrameが空であるかどうかを確認する方法です。Javaを使用してSparkでカウントチェックを行う以外に、DataFramesが空であるかどうかをチェックする方法はありますか?
DataFrame dfが何百万ものレコードを取得すると、上記のステートメントは実行に時間がかかりすぎると私は心配しています。
上記のコードでは、dfが有効なオブジェクトではない場合、NullPointerExceptionが発生します。一般に 'Object.count()'は安価な呼び出しです。 –
はい、dfはDataFrameとして適切に宣言され、初期化されます。しかし、シナリオは値を持つこともあれば、空でもnullでもかまいません。 – user5626966