私は2次元配列を持っています。配列に値を追加すると、重複する値があります。どうすればこれらを削除できますか?名前の私のARAYは、:次のようになります。2d配列の重複を削除するPython
[[u'82', <a href="/12222/">Button</a>], [u'67', <a href="/12333/">Button</a>], [u'23', <a href="/12344/">Button</a>], [u'19', <a href="/12345/">Button</a>], [u'23', <a href="/12344/">Button</a>]]
私は
import numpy as np
def unique(a):
order = np.lexsort(a.T)
a = a[order]
diff = np.diff(a, axis=0)
ui = np.ones(len(a), 'bool')
ui[1:] = (diff != 0).any(axis=1)
return a[ui]
そして
[list(t) for t in set(tuple(element) for element in a)]
そして
from pandas import *
import numpy as np
a = np.array([[1, 1], [2, 3], [1, 1], [5, 4], [2, 3]])
DataFrame(a).drop_duplicates().values
を試してみました。しかし、それらのどれも動作しません。 2d配列から重複を削除するにはどうすればよいですか?
あなたの 'a'には重複はありません、' drop_duplicates(サブセット= 'a') 'は – EdChum
@EdChumですが、データフレームはまずサブセットとして参照する前に作成する必要があります。 OPはこれをすべて1つのステップで実行しようとしていたため、失敗しました。 – tnknepp