1
私は、別のデータフレームに一致する値がある場合、ある種類のステータスを持つ列を追加することはできません。私は働く現在のコードを持っている:パンダDataFrame適用効率
df1['NewColumn'] = df1['ComparisonColumn'].apply(lambda x: 'Match' if any(df2.ComparisonColumn == x) else ('' if x is None else 'Missing'))
私はラインが醜いですけど、私は、その非効率的な印象を受けます。あなたはこの比較をするより良い方法を提案できますか?
あなたがnp.where
、
isin
、および
isnull
を使用することができます
これは大変ありがとうございます。私はそれを実装しましたが、少し速く、はっきりと明確です。それがなぜより速いのかあなたはコメントできますか?私の元の投稿には、比較がテキスト比較であるかもしれないということがあります。 numpyを使ってテキスト比較を行うのは面白いようです。 – user3535074
@ user3535074はい、適用は多少遅い操作ですが、Pandasとisin関数で制御が行われ、比較が行われている場合はNumpyを使用しています。 –