2017-10-13 5 views
0

xpathを使用してスクラップするURLを作成するために、私のcsvファイル内に存在する以前のスクリプトでスクラップしたウェブサイトコードを使用しようとしています。値はcsv内の「リンク」列内にあります。私はここで、以下のエラーに特にラインで32AttributeError: 'Series'オブジェクトにパンダを使用する属性 'get_type'がありません。

File "Willisp3.py", line 32, in <module> 
uClient = uReq(url) 
File "/Users/gil/anaconda/lib/python2.7/urllib2.py", line 154, in 
urlopen 
return opener.open(url, data, timeout) 
File "/Users/gil/anaconda/lib/python2.7/urllib2.py", line 421, in 
open 
protocol = req.get_type() 
File "/Users/gil/anaconda/lib/python2.7/site- 
packages/pandas/core/generic.py", line 2970, in __getattr__ 
return object.__getattribute__(self, name) 
AttributeError: 'Series' object has no attribute 'get_type' 

を実行しています私のコードは、あなたの変数urlシリーズ、ない文字列である

`filename = 'links.csv' 
df = pd.read_csv(filename) 
imdbcode = df['link'] 


for index, row in df.iterrows(): 
    url = ('https://www.imdb.com/title/' + imdbcode + '/reviews?ref_=tt_urv') 
    uClient = uReq(url) 
    content = uClient.read() 
    uClient.close() 
    page_soup = soup(content, "html.parser") 
    page_soup = soup(content, "lxml-xml") 
    page = requests.get(url) 
    stuff2 = html.fromstring(page.content) 
    comment = stuff2.xpath('//div[@id="tn15content"]/p/text()')[0] 
    title = stuff2.xpath('//div[@id="tn15title"]/h1/a/text()')` 
+0

What's line 32?トレースバック全体を見せてみませんか? –

+0

ちょうどそれを追加しました。私はそれを最初に持っていないことをお詫びします。 –

+0

エラーは関数 'uReq'にありますが、' uReq'は定義されておらず、コードのどこにでもインポートされていません。 –

答えて

0

です。 imdbcodeを初期化すると一連のリンクとなり、起動するとパンダは各行に文字列の追加をブロードキャストします。

私は他のものを見ることなく確実に知ることはできませんが、単なる文字列の値を取得する代わりに

url = 'https://http://www.imdb.com/title/' + row['link'] + '/reviews?ref_=tt_urv' 

をしたいです。

+0

素晴らしいです。これは私のためにそれを解決しました。ありがとうございました! –

+0

ちょっと@ギルバートリー、それはあなたのためにうまくいってうれしい。私の答えを受け入れる気にならないなら、私はそれを感謝するだろう – breucopter

関連する問題