2016-11-09 6 views
0

GooglePlayの検索でパッケージ名をフィルタリングしようとしました。したがって、ユーザーは「Facebook」で入力し、スクリプトはパッケージ名を認識します。 私はBeautifulSoup4でこれをやろうとしています。私はそれがこれのための最善の解決策だと思います。私はパッケージ名を取得するにはどうすればよいGooglePlay出力のPythonフィルタパッケージ名

[<div class="card-content id-track-click id-track-impression" data-docid="com.facebook.katana" (and so on) 

..だから ここに私のコードは、私が

br = mechanize.Browser() 
br.set_handle_robots(False) 
br.addheaders = [('User-agent', 'chrome')] 

term = "faceboook" 
query = "http://play.google.com/store/search?q="+term 

htmltext = br.open(query).read() 

soup = BeautifulSoup(htmltext) 

search = soup.findAll("div", class_="card-content id-track-click id-track-impression") 

print search 

出力をしようとしたのか?私は本当にどのように知りません。私はすでにBeautifulSoupに関するいくつかの文書を読んでいますが、私はこの拡張をどのように使っているのか分かりません。

あらかじめありがとうございました。

答えて

1

私が理解から、あなたは/ data-docid属性の値を取得する必要ができます。

[item.get("data-docid", "n/a") for item in search] 
+0

をcom.facebook.orca」、 『com.facebook.katana』 [ありがとう、今は」を取得'、' com.facebook.Mentions '、' com.htc.sense.socialnetwork.facebook '、' com.twitter.android '、' com.instagram.android '" – Lucas

+0

これを現在どのようにフィルタリングできますか?私はそこで分割することはできません – Lucas