pysparkのmapPartitions()に渡す関数内でprintステートメントを使用してコードをデバッグできないという問題をどのように処理できますか?mapPartitionsに渡された関数をデバッグする方法
は例を考えてみましょう:FUNCインサイド
def func(kv_iterator):
for key, value in iterator:
#do fancy stuff
print('This print statement does not reach the driver program')
return [result]
result = someRdd.mapPartitions(func)
を私は反復可能オブジェクトとインデックスに多くの作業を行いたいのですが、私はFUNC内部変数への過剰せずに自分のコードをテストすることができます。
print文をどういうわけか1つのパーティションから私のドライバのprogramm/outputチャンネルにリダイレクトすることはできますか?