私は「アクション」という名前の新しい列を取得したいと思いpysparkのUDFは、
import pandas as pd
ndf = pd.DataFrame({'a':[False, False,True,True,False], 'b':[False, False,False,False, True]})
ndf_s = sqlContext.createDataFrame(ndf)
としてデータフレームを持っています。これは、ndf ['a']がTrueの場合、2つの値を含むことができます。ndf ['b']がTrueの場合、「action」の値は「I am a」、「action」の値は「I am b」、 。それ以外の場合は値を取得しない。あなたはwhen.otherwise
を使用することができます
ndf_result = sqlContext.createDataFrame(pd.DataFrame({'a':[False, False,True,True,False], 'b':[False, False,False,False, True], 'action':[None, None, 'I am a', 'I am a', 'I am b']}))
両方の列がTrueのチャンスはありますか? – Psidom
可能、その場合は、 "私はaとb"に "アクション"を送信 –