AttributeError
または他の実行時例外を投げる前に30分実行するpyspark.sql
のApache Sparkデータロードおよび変換アプリケーションがあります。Sparkアプリケーションでステートメントのシーケンスを段階的に実行する方法を教えてください。
Apache PigのILLUSTRATE
のような小さなデータサンプルを使用してアプリケーションをエンドツーエンドでテストしたいと考えています。データをサンプリングすることはあまり役に立ちません。これを行う簡単な方法はありますか?