私は2つの列User_IDとItem_IDを持っています。ここでは、0または1のいずれかの値を含む新しい列「並べ替え」を作成します.0は特定のユーザーが項目を1回だけ注文したとき、1は特定のユーザーが項目を複数回注文したときです。 これは、User_IDをグループ化してからapply関数を使って重複した項目を1としてマッピングし、0と重複しないようにすることで実現できると思いますが、正しいPythonコードを見つけることができません。 誰かがこれを手伝ってくれたら助かります。パンダのgroupbyオブジェクトで重複を見つけてマッピングする
1
A
答えて
1
パラメータkeep=False
のSeries.duplicated
をすべての複製に使用できます - 出力はTrue
とFalse
です。最終astype
によってint
秒に変換します。
df['Reordered'] = df['User_ID'].duplicated(keep=False).astype(int)
はサンプル:
df = pd.DataFrame({'User_ID':list('aaabaccd'),
'Item_ID':list('eetyutyu')})
df['Reordered'] = df['User_ID'].duplicated(keep=False).astype(int)
print (df)
Item_ID User_ID Reordered
0 e a 1
1 e a 1
2 t a 1
3 y b 0
4 u a 1
5 t c 1
6 y c 1
7 u d 0
それとも、各ユーザごとにチェックduplicates
ためDataFrame.duplicated
が必要になります。
df['Reordered'] = df.duplicated(['User_ID','Item_ID'], keep=False).astype(int)
print (df)
Item_ID User_ID Reordered
0 e a 1
1 e a 1
2 t a 0
3 y b 0
4 u a 0
5 t c 0
6 y c 0
7 u d 0
+1
私はその2番目と思う – piRSquared
+0
ええ、2番目の私は完璧に動作します。ありがとう@jezrael –
関連する問題
- 1. パンダを使用して列間の重複を見つける
- 2. オブジェクトの配列で重複するものを見つけ、
- 3. パンダのデータフレーム内の重複する行をすべて見つけよう
- 4. パンダを使って重複する名前を見つける方法は?
- 5. オブジェクトの配列で重複を見つける
- 6. Elasticsearchで重複を見つける
- 7. 配列で重複を見つける
- 8. 重複する円を見つける
- 9. 配列内の最も重複したオブジェクトを見つける
- 10. セッションの重複を見つける
- 11. C#データの重複を見つける
- 12. iPhoneアプリの重複を見つける
- 13. パンダのgroupbyオブジェクトをピボットするには?
- 14. リストから重複したオブジェクトを見つける方法
- 15. NSArrayで重複を見つけよう
- 16. 2つの配列で重複する値を見つける
- 17. 重複を見つけるアルゴリズム
- 18. リストに重複を見つける
- 19. パンダで重複を見つけてナン以外の値で日付で修正する
- 20. R:データフレームで重複を見つけてベクトルに記録する
- 21. mongo db/robomongpのすべての重複を見つける
- 22. すべての重複の平均を見つける
- 23. 複数の列とドロップ行で重複を見つける - Pandas
- 24. Python - リスト内の重複アイテムを見つけて破棄する
- 25. 2つのテーブル間で重複を見つける
- 26. 2つのDGVで重複を見つける
- 27. パンダ複数列Groupbyプロット
- 28. C++で文字列の重複するエントリを見つける
- 29. のMySQL:複数のフィールド間で見つける重複
- 30. パンダまたは列挙を使用して2つのデータセット間の重複/範囲を見つけよう
あなた少なくともあなたが書いたコードを共有することができますこれまでのところ ??またはあなたが直面している問題 – warl0ck