レッツは、私は三つの変数と、この単純化されたデータフレーム持っていると言う:groupbyを使って2つのグループの違いをどうやって使うのですか?
ID sample test_result
P1 Normal 9
P2 Normal 7
P3 Normal 2
P1 Tumor 6
P2 Tumor 5
P3 Tumor 3
を私は正常および腫瘍test_results
との違いを知りたいが、私はそれにアプローチする方法がわからないです。
sample
カラムでgroupbyを使用してからカラムのdiff()
メソッドを使用してみましたが、機能しませんでした。ここで
は、私が試したものです:
df.groupby('sample')['test_result'].diff()
私は期待していた出力は次のようである:これに対処する方法を
ID test_result
P1 3 # the difference between P1 Normal and P1 Tumor (i.e. 9-6)
P2 2
P3 -1
任意のアイデア?
を使い続けることができますカラム。 '.pivot'エラーメッセージを避けるための回避策がありますか?' ValueError:重複したエントリが含まれているインデックスには再形成できません '?ありがとう! – MEhsan
その場合は、ID列とサンプル列を最初に集計する必要があります。 – Psidom
あなたはどのように私を見せてくれますか? – MEhsan