データフレーム内の複数の配列の要素単位の標準偏差を取得する方法を、最初の3行は次のようになります。はPythonは:私は、各セルではなく、大きなデータフレーム(DF)を含む配列とはNaNを持って
df:
A B C
X [4, 8, 1, 1, 9] NaN [8, 2, 8, 4, 9]
Y [4, 3, 4, 1, 5] [1, 2, 6, 2, 7] [7, 1, 1, 7, 8]
Z NaN [9, 3, 8, 7, 7] [2, 6, 3, 1, 9]
私はすでに、私はこれを取得するように各列の行の上に意味要素単位取る方法(thanks to piRSquared)を知っている:
element_wise_mean:
A [4.0, 5.5, 2.5, 1.0, 7.0]
B [5.0, 2.5, 7.0, 4.5, 7.0]
C [5.66666666667, 3.0, 4.0, 4.0, 8.66666666667]
今、私はそれぞれの標準偏差、任意のアイデアを取得する方法だろうか?また、私はまだgroupby()がやっていることを理解していない、誰かがその関数をより詳しく説明できますか?
np.random.seed([3,14159])
df = pd.DataFrame(
np.random.randint(10, size=(3, 3, 5)).tolist(),
list('XYZ'), list('ABC')
).applymap(np.array)
df.loc['X', 'B'] = np.nan
df.loc['Z', 'A'] = np.nan
element_wise_mean
df2 = df.stack().groupby(level=1)
element_wise_mean = df2.apply(np.mean, axis=0)
element_wise_sd
element_wise_sd = df2.apply(np.std, axis=0)
TypeError: setting an array element with a sequence.
DF
numpy array
に変換して、ラムダを使用してnp.std適用
numpyの配列の値に試してみてください - 'df2.apply(ラムダX:NPを。 std(x.values)) '? – Zero
私はあなたの種の価値を見て非常に満足している誰かを知っています。 –
@cᴏʟᴅsᴘᴇᴇᴅはそれがpirsquaredですか? – Dark