から特定の値の利用可能性を示しています、私は最初のグループにdrug_idに基づいてデータをつもりですグループと、私はこのデータフレームを持っている別の列
df1:
drug_id illness
lexapro.1 HD
lexapro.1 MS
lexapro.2 HDED
lexapro.2 MS
lexapro.2 MS
lexapro.3 CD
lexapro.3 Sweat
lexapro.4 HD
lexapro.5 WD
lexapro.5 FN
、およびHD、MSの可用性を検索病気の欄にはFNが表示されます。次に、次のような2番目のデータフレームを記入してください。
df2:
drug_id HD MS FN
lexapro.1 1 1 0
lexapro.2 0 1 0
lexapro.3 0 0 0
lexapro.4 1 0 0
lexapro.5 0 0 1
これは私のグループ化コードです。
df1.groupby('drug_id', sort=False).isin('HD')
が、私は'HD'
はdf1
でそのdrug_id
のために利用可能であった場合、私は、各drug_idについてF2['HD']
に1を割り当てることができるのか分かりません。
ありがとうございます。
代替。illness.str.get_dummies()。和(レベル= 0)[ 'HD'、 'MS'、 'FN']]。 ge(1).astype(int) ' –
@COLDSPEED、ありがとう。あなたが書いた3種類のコードを試しましたが、id_columnという薬を再編成しました。私のデータ列のサイズは805行で、他の薬剤名(Effexor、zoloft、...)も含まれています。それを避ける方法はありますか?再度、感謝します。 – Mary
@Maryまた、この質問を閉じて、この回答を受け入れるようにしましょう〜 – Wen