2017-08-14 10 views
1

私はので、ここで考慮それを取ってくださいPythonのに新しいです..、誤った結果

私は、特定の検索URLを取得するスクリプトを記述しようとしています私の名前が検索結果に含まれる場合は、はいまたはいいえを返します。

これまでのところ、URL自体に自分の名前を含めると、if文にフラグが立てられていると思います。私は私の名前を少し難しくしましたが、その値だけでは結果は得られません。しかし、結果がゼロであることを知っていれば、はいを返します。

from bs4 import BeautifulSoup 
import re 
import requests 

thesite = "http://www.peoplefinder.com/people-search/MT-Fname-Lname/" 
response = requests.get(thesite) 
soup = BeautifulSoup(response.text, 'html.parser') 
test = soup.findAll(text=re.compile('Fname Lname')) 
r = requests.get('http://www.peoplefinder.com/people-search/MT- 
Fname Lname') 
if 'Fname Lname' in r.text: 
    print('Yes') 
else: 
    print('No') 

答えて

0

これはまったく簡単なことではありません。しかし、私はあなたを道の一部にすることができます。

私はモンタナには存在しない名前を探し、Millicent Harcourtが請求書を埋めることがわかりました。私はこのサイトの結果ページが常にいくつかの一致を見つけたと主張しているため、これを行いました。失敗したページを解析できるように、結果ページがどのようなものになるかを確認する必要がありました。

このコードでは、Millicentの結果を読み込み、「一致」として提供された名前を探します。

>>> import requests 
>>> import bs4 
>>> page = requests.get('https://www.ussearch.com/search/people/Millicent/~/Harcourt/MT').content 
>>> soup = bs4.BeautifulSoup(page, 'lxml') 
>>> links = soup.select('.memberTeaserName a') 
>>> for link in links: 
...  link.text.strip() 
... 
'Michael Frank Harcourt' 
'Michael C Harcourt' 
'Maryjean Harcourt' 
'Mary L Harcourt' 
'Mandy Harcourt' 

私たちにとって、人間としては、姓とはまったく似ていません。これらの名前のどれかがMillicent Harcourtと同じであるかどうか、あなた自身の満足度を決める方法を考えることができない場合、それは別のSOの質問の良い主題になります。

+0

私は回答内容とあなたが選んだ名前の両方をあなたにアップアップしてもらいました:) 幸いにも、peoplefinder.comのサイトは私の名前のためにゼロの結果を返しています。ほとんどではないので、どちらが奇妙であるか。私はこのチュートリアル/スクリプトを最終的に結果(正確な名前でもバリエーションでも)をCSVにパイプして、それをさらにgrokingするか手動で検査するための足がかりとして使用しています。 – Skeer

+0

@Skeer:あなたは、あなたがまだ回答をアップアップすることはできませんが、それがあなたを助けてくれたかどうか、それを受け入れることができます。このように質問に1つの回答のみをマークすることができます。 –

0

何が起こるかは、あなたがr.text内で検索名は、とにかく表示されていることである - それは、常に結果ページのタイトルに返されます:人は「doesnの場合でも

<title>Mt Fname Lname on PeopleFinder.com | Free People Search with Addresses and Phone Numbers</title> 

存在しない。検索するには、もっと具体的なものを見つける必要があります。よりユニークなhtml要素を見つける必要があります。

+1

どういうわけか、HTMLコード内の特定のclass/divオブジェクトの検索フィールドを絞り込むのはどうですか? – Skeer

関連する問題