私はいくつかの行を削除するデータフレームを持っています。結果として、私はインデックスが何かのようなデータフレームを得ます:[1,5,6,10,11]
と私は[0,1,2,3,4]
にそれをリセットしたいと思います。どうしたらいいですか?パンダのデータフレームのインデックスをリセットするにはどうすればいいですか?
df = df.reset_index()
del df['index']
次は動作しません:
df = df.reindex()
私はいくつかの行を削除するデータフレームを持っています。結果として、私はインデックスが何かのようなデータフレームを得ます:[1,5,6,10,11]
と私は[0,1,2,3,4]
にそれをリセットしたいと思います。どうしたらいいですか?パンダのデータフレームのインデックスをリセットするにはどうすればいいですか?
df = df.reset_index()
del df['index']
次は動作しません:
df = df.reindex()
reset_index()
は、あなたが探しているものである
が動作しているようです以下
を追加しました。あなたはそれが列として保存されたくない場合は、操作を行います。
df = df.reset_index(drop=True)
別の解決策が割り当てRangeIndex
またはrange
です:
df.index = pd.RangeIndex(len(df.index))
df.index = range(len(df.index))
それは速いです:用
df = pd.DataFrame({'a':[8,7], 'c':[2,4]}, index=[7,8])
df = pd.concat([df]*10000)
print (df.head())
In [298]: %timeit df1 = df.reset_index(drop=True)
The slowest run took 7.26 times longer than the fastest. This could mean that an intermediate result is being cached.
10000 loops, best of 3: 105 µs per loop
In [299]: %timeit df.index = pd.RangeIndex(len(df.index))
The slowest run took 15.05 times longer than the fastest. This could mean that an intermediate result is being cached.
100000 loops, best of 3: 7.84 µs per loop
In [300]: %timeit df.index = range(len(df.index))
The slowest run took 7.10 times longer than the fastest. This could mean that an intermediate result is being cached.
100000 loops, best of 3: 14.2 µs per loop
@Outcast Source - 最速は' len(df.index) '、381nsと' df.shape' 1.17usです。何か不足している? – jezrael
+1 'drop = True' – Rhubarb
データフレームを同じ変数に再割り当てするのではなく、' inplace = True'引数を設定することができます。 – ahuelamo
'inplace = True'の場合、メソッドはNoneを返します。 – alyaxey