私はいくつかの顕微鏡スライドの実験データを持っています。スライドごとに私はいくつかの写真画像を撮影しており、それぞれの画像に多数の標本があります。観測値を追加してデータフレームの行を減らす
例:
from pandas import DataFrame, Series
import seaborn as sns
data = {'Slide' : [0,0,0,0,0,0,0,0,0, 0,0,0, 9,9,],
'Image' : [1,1,1,1,1,1,1,1,1, 2,2,2, 1,7],
'Specimen' : [1,1,1,1,2,2,3,3,3, 1,1,1, 1,1],
'Foci' : [8,9,7,9,6,9,7,9,6, 6,7,6, 9,6]}
df = DataFrame(data, columns=['Slide','Image','Specimen','Foci'])
df
:スライド0で、私は合計(画像1で3、画像2の1)の4つの標本を持って各スライドのために私は私が持っているショーの多くの標本を知りたいのですが
私は答えに一部の方法を取得することができますが、私はまだスライドごとに標本番号を追加する必要があるとして、これは、私が必要とかなりものではありません。
df.groupby(['Slide','Image']).max()
あなたは、各スライドの
.sum()
をすることができます次に
uniques = df.groupby(['Slide', 'Image'])['Specimen'].nunique()
:
uniques.groupby(level='Slide').sum()
を取得する:
ほぼそこに! slide0に4つの標本があり、スライド9に2つの標本があるという答えを私に与えるために、各スライドの標本数をどのようにSUMにするのですか? – thescoop
最後のビットを含めるように編集しました。 @thescoop –