sklearnの適用中にパンダのインデックスを保持する

DateTimeインデックスを持つデータセットがあり、SklearnのPCAを使用してディメンション数を減らしています。sklearnの適用中にパンダのインデックスを保持する

次の質問バグ私は元のデータフレームからインデックスを再利用できるように、PCAが自分のシリーズのポイントの順序を保持しますか？

df = pd.DataFrame(...) 
df2 = pca.fit_transform(df) 
df2.index = df.index

また、これを行うよりも安全な方法がありますか？

2017-02-01 Marko

インデックスを再作成すると、「pca.fit_transform（df）.reindex（index = df.index）？ –

私は何をしているのですか？ – Marko

そうは思わない。これにより、インデックス軸の不必要な再割り当てを取り除くことができます。 –

インデックスはPCAによって削除されますが、行の基本的な順序は残ります（PCA *の変換機能の実装を参照）。したがって、df2.index = df1.indexを持つことは安全です。

* fit_transformはfitと同じで、変換します。それらのいずれも行の順序を変更しません。

2017-03-21 13:32:04 user2685079

答えて