2017-12-20 22 views
0

私は機械学習のためのフィーチャデータセットを生成しています.2次元のnumpy配列Xがあります。ここでX.shape =(n、d) - n個のサンプルとd個のフィーチャです。横型スタック2次元ナンプィアレイと3次元ナンプイ配列

ここで、f.shape =(n、1、k) - n個のサンプル、k個のラベルを1ホットエンコーディング-fで新しいフィーチャを生成します。

私の既存のフィーチャデータセットにこの新しい機能を追加するにはどうすればよいでしょうか?

+2

何フィーチャデータセットの最終形状でしょうか? – Divakar

+0

私はsklearnのライブラリを使って作業していますが、既存のフィーチャセットにワンホットラベル機能を実装する標準的な方法は何ですか? –

+0

私はkの新しい機能のように扱います ' np.c_ [X、 f.reshape(n、k)] 'となります。 –

答えて

1

ワンホットベクトルの2番目の次元は冗長なので、それを削除してfを形状の2次元配列(n, k)として使用できます。 。あなたのような何かだろう
squeeze()機能を使う配列からすべての1次元を削除し

new_data = np.concatenate((X, f.squeeze()), axis=1) 

(すなわちf.squeeze().shape == (n, k)

乾杯を