2016-05-22 22 views
1

私はデータを持つ配列を持っており、私は各データを2回持っていることに気付きました。アレイの内容を簡素化するために複製データを削除する方法はありますか?以下は、私はPythonで作られたコードは次のとおりです。私はPythonで配列から重複データを削除します

import requests 
import re 
import bs4 

r = requests.get("http://as.com/tag/moto_gp/a/") 

r.raise_for_status() 

html = r.text 


matches = re.findall(r"http://motor\.as\.com/motor/\d+/\d+/\d+/motociclismo/\d+_\d+.html", html) 

print (matches) 

答えて

7

私はあなたのmatchesはあなたが簡単な方法を使用することができますlist.Thenであると思います。

In [1]: a = [1,1,2,2,3,3,4,4,5] 
In [2]: list(set(a)) 
Out[2]: [1, 2, 3, 4, 5] 

コードには1つの変更のみが含まれます。

matches = list(set(re.findall(r"http://motor\.as\.com/motor/\d+/\d+/\d+/motociclismo/\d+_\d+.html", html))) 
+0

実際、これは任意の反復可能関数に対して機能します。 –

+0

それは働いている!ありがとう、あなたは天才です:) – Albert

+0

@SergeiLebedevあなたは正しいです。それはすべての反復可能で動作します。 –

関連する問題