私は寄木細工のファイルを読み込んでおり、準備されたdictを使用して の行をフィルタリングしたいと思います。データフレームには、col1とcol2という2つの列があり、それぞれstring型です。私の辞書には文字列があり、col1とcol2の文字列の連結が辞書にある行が必要です。私はpysparkの2つの列を連結してフィルタリングする方法
df.filter((df['col1']+df['col2']) in my_dict)
を試してみましたが、df['col1']+df['col2']
はそれが列のタイプであっても、文字列ではないようです。
私も
df.filter(lambda x: (x['col1']+df['col2']) in my_dict)
これを行うための正しい方法は何が?試してみましたか
内容に関係なく、 'df ['col1']'と 'df ['col2']'は 'pyspark.sql.column.Column'型であり、型文字列ではありません – desertnaut