-2
pandasデータフレームで関数を使用して非常に単純な変換を行っていますが、関数が入力データフレームを変更するとは思いませんでした。私はここになぜ...Python関数が予期せず動作する
を思っていた私のコードです:
x = pd.DataFrame({'a': [1,2,3], 'b': [3,4,5]})
def transform(df, increment):
new_df = df
new_df.a = new_df.a + increment
return new_df
new_x = transform(x, 1)
new_x # output shows new_x.a is [2,3,4], which is expected.
x # output shows x.a is also [2,3,4]. I thought it should be [1,2,3]
これが事実であるのはなぜ?私は、この機能では、すべての操作がnew_df
で実行されると思いますので、入力x
は、このtransform
の機能を実行する前とまったく同じ状態を保つ必要がありますか?
'new_df = df'の別の「参照」データフレームをコピーしません。 *同じ*オブジェクトへの別の参照を作成するだけです。 –
はい、 'new_df'と' df'は同じオブジェクトの2つの名前です。 – kindall
'new_df = df.copy()' –