2017-02-01 2 views
0

DateTimeインデックスを持つデータセットがあり、SklearnのPCAを使用してディメンション数を減らしています。sklearnの適用中にパンダのインデックスを保持する

次の質問バグ私は元のデータフレームからインデックスを再利用できるように、PCAが自分のシリーズのポイントの順序を保持しますか?

df = pd.DataFrame(...) 
df2 = pca.fit_transform(df) 
df2.index = df.index 

また、これを行うよりも安全な方法がありますか?

+0

インデックスを再作成すると、「pca.fit_transform(df).reindex(index = df.index)? –

+0

私は何をしているのですか? – Marko

+0

そうは思わない。これにより、インデックス軸の不必要な再割り当てを取り除くことができます。 –

答えて

0

インデックスはPCAによって削除されますが、行の基本的な順序は残ります(PCA *の変換機能の実装を参照)。したがって、df2.index = df1.indexを持つことは安全です。

* fit_transformはfitと同じで、変換します。それらのいずれも行の順序を変更しません。

関連する問題