2016-12-11 15 views
1

これはすべてのインターウィキリンクを取得する私のプログラムです(多くはliタグです)。しかし、私は特定の言語liタグを取得したいだけです。私のプログラムでカテゴリの特定のインターウィキリンクを取得するにはどうすればよいですか?

<li class="interlanguage-link interwiki-ta"> ...title= </li> 

title=のデータはどのように取得できますか?次のように

は、どのように私は私のコードを完了することができます; -

コマンド:python3 get-tamiwiki-link-from-englishwiki.py

from bs4 import BeautifulSoup 
import requests 
url = 'https://en.wikipedia.org/wiki/Category:proprietary software' 
content = requests.get(url).content 
soup = BeautifulSoup(content,'lxml') 
#to get all the li tag 
interwikihead = soup.find(id='p-lang') 
print(interwikihead) 
#print(interwikihead.text) 

答えて

0
from bs4 import BeautifulSoup 
import requests 
# li class="interlanguage-link interwiki-ta" 
url = 'https://en.wikipedia.org/wiki/Category:proprietary software' 
content = requests.get(url).content 
soup = BeautifulSoup(content,'lxml') 
#to get all the li tag 
interwikihead = soup.find('li', class_="interlanguage-link interwiki-ta") 
print(interwikihead.text) 
try: 
    title = interwikihead.a.get('title') 
    print(title) 
except: 
    print('title no find') 

アウト:

தமிழ் 

பகுப்பு:தனியுடைமை மென்பொருட்கள் – Tamil 
+0

グレート。タミル語に出力がない場合、どのようにエラーメッセージを避けることができます。 –

+0

タミールとは何ですか? ? –

+0

タミル語は言語です。あなたの出力、すなわちタミルを参照してください。 taはウィキメディアのTamilのisoコードです。そこで、「interlanguage-link interwiki-ta」をsoup.findとしてコード化しました。 –