2017-09-05 4 views
1

私は巨大なデータフレームを持ち、列の各値を正規化し、平均とstd.devを使用してすべての列を順番に処理する最も効率的な方法を見つけようとしています。パンダデータフレームの各列の値を正規化

次のようにデータフレームのサンプルは次のとおりです。 [ "340"] COLの平均を見つける:正規化のための

for column in df.iteritems(): 
df.mean() 
df.std() 

...さらに計算を私はしたい

TimeStamp   340   341   342   343  
0 10:27:30  1.953036  2.110234  1.981548  1.705684 
1 10:28:30  1.973408  2.046361  1.806923  1.496244 
2 10:29:30  0.000000  0.000000  0.014881  0.198947 
3 10:30:30  2.567976  3.169928  3.479591  3.557881 
4 10:31:30 4415.498729 5075.996948 5653.925541 6133.202200 
5 10:32:30 4473.930295 5146.802497 5736.030854 6224.380260 

しかし、私はパンダに非常に新しいですし、働いていません.... :( 私は平均一列を見つけることができますが、私は2500 colsを持っています

答えて

1

あなたのデータを正規化するために探している場合、あなたは(X-平均)/標準偏差の正規化をしたいと仮定すると、この

(df.iloc[:,1:] - df.mean().values)/df.std().values 

を行うことができます。注:df.loc[]は、タイムスタンプの最初の列を除外するために使用されました。

+0

:)ありがとうございました!ネストされたループは私にトラブルを与えていた....それは完璧です!私はそれが必要なものを正確に行います!!! –

関連する問題