2016-10-19 14 views
0

私は、すべてのタグの1つのホットエンコーディングである配列を持つ和numpyの配列

[ 
[ 
    [0,0,0] 
    [1,0,0], 
    [0,0,1] 
], 
[ 
    [0,0,0], 
    [0,0,0], 
    [0,0,1], 
] 
] 

ように私はこれを取得したい:

[ 
[1,0,1], 
[0,0,1] 
] 

配列のをタグは同じサイズにパディングされています([0,0,0]はタグなしを意味します)

どうすればいいですか?私は多くのことを試してみましたが、私はPythonとnumpyのノブです。

EDIT

私はこれが

[np.sum(x, axis=0) for x in array_tags] 

が、パイソン(2.7)私はそれを実行した場合の崩壊を働くべきだと思います。どんな手掛かり?

+2

単純に2番目の軸に沿って合計します: 'arr.sum(1)'? – Divakar

+0

'np.sum(tags_array、axis = 0)'を試しましたが、Pythonが崩壊(kill 9)したのですが、なぜわかりません –

+1

'axis = 1'はどうですか? – Divakar

答えて

0

私はscikit-learnで欲しいものを見つけました。私は使用する必要がありますMultiLabelBinarizer