0
Bing Web Search APIを使用して、非常に特定のクエリに一致するURLを取得しています。残念ながら、APIの結果には多くの迷惑があります。Bing Web Search APIとブラックリスト(Python)
今、私は大体のブラックリストを作成しました。この "ジャンク"の70%
「結果」配列にそのURLのリストを追加しないようにする最も効果的な方法は何ですか?
コードの興味深い部分:
results = []
try:
conn = http.client.HTTPSConnection('api.cognitive.microsoft.com')
conn.request("GET", "/bing/v5.0/search?%s" % params, "{body}", headers)
response = conn.getresponse()
data = response.read()
json_file = json.loads(data)
for i in range(len(json_file['webPages']['value'])):
results.append([count, json_file['webPages']['value'][i]['displayUrl']])
conn.close()
except Exception as e:
print(e)
これは本当にあなたのブラックリストの仕組みに依存します。 –