2017-07-06 14 views
0

Bing Web Search APIを使用して、非常に特定のクエリに一致するURLを取得しています。残念ながら、APIの結果には多くの迷惑があります。Bing Web Search APIとブラックリスト(Python)

今、私は大体のブラックリストを作成しました。この "ジャンク"の70%

「結果」配列にそのURLのリストを追加しないようにする最も効果的な方法は何ですか?

コードの興味深い部分:

results = [] 
try: 
    conn = http.client.HTTPSConnection('api.cognitive.microsoft.com') 
    conn.request("GET", "/bing/v5.0/search?%s" % params, "{body}", headers) 
    response = conn.getresponse() 
    data = response.read() 
    json_file = json.loads(data) 
    for i in range(len(json_file['webPages']['value'])): 
     results.append([count, json_file['webPages']['value'][i]['displayUrl']]) 
    conn.close() 
except Exception as e: 
    print(e) 
+0

これは本当にあなたのブラックリストの仕組みに依存します。 –

答えて

0

あなたは、この目的のためにカスタム検索をビンビン試すことができます。それはあなたがブロック機能と一緒に特定のドメイン/サブサイト/ウェブページに結果を制限することができます。 customsearch.aiの詳細を確認することができます。無料アクセスキーはhttps://azure.microsoft.com/en-us/try/cognitive-services/?api=bing-custom-searchから入手できます。

関連する問題