2017-05-09 15 views
2

再誰かが、beautifulsoup、のpython3を使用してサイトからeBayのフィードバックを取得する方法を再...のpythonを使用してURLからeBayのフィードバックを得るために、BeautifulSoupは、

を知っているんどのように私はこのコードを持っていますが、それを見つけるのは容易ではありませんフィードバック。

import urllib.request 
import re 
from bs4 import BeautifulSoup 

fhand = urllib.request.urlopen('http://feedback.ebay.com/ws/eBayISAPI.dll?ViewFeedback2&userid=nana90store&iid=-1&de=off&items=25&searchInterval=30&which=positive&interval=30&_trkparms=positive_30') 

for line in fhand: 
    print (line.strip()) 
    f=open('feedbacks1.txt','a') 
    f.write(str(line)+'\n') 
    f.close() 


file = open('feedbacks1.txt', 'r') 
cleaned = open('cleaned.txt', 'w') 
soup = BeautifulSoup(file) 
page = soup.getText() 
letters_only = re.sub("[^a-zA-Z]", " ", page) 
cleaned.write(str(letters_only)) 
+0

コードはHTMLファイルの各行を取得しますが、ページに含まれる実際のデータにアクセスする必要があります。 BeautifulSoupはDIVやテーブルのセルなどを直接参照することができます。eBayページのソースコードを参照し、フィードバックの構造を特定し、それに応じてバージョンをコードします。 – samiles

答えて

2

あなただけの、これはあなたが探しているものかもしれないフィードバックテキストの世話をした場合:

import urllib.request 
import re 
from bs4 import BeautifulSoup 

fhand = urllib.request.urlopen('http://feedback.ebay.com/ws/eBayISAPI.dll?ViewFeedback2&userid=nana90store&iid=-1&de=off&items=25&searchInterval=30&which=positive&interval=30&_trkparms=positive_30') 
soup = BeautifulSoup(fhand.read(), 'html.parser') 
table = soup.find(attrs = {'class' : 'FbOuterYukon'}) 
for tr in table.findAll('tr'): 
    if not tr.get('class'): 
     print(list(tr.children)[1].getText()) 

私が第1のフィードバック(なしクラスを含む行、その後、フィードバックを持つテーブルを探しています)、関連する行を解析して対応するテキストを解析します。これは、同様のニーズに適合させることもできます。

+0

youuu soooたくさんありがとう...これはまさに私が必要なものです –

関連する問題