pythonを使って休憩なしにhtmlを印刷するには、beautifulsoup？このようbeautifulsoup使用

イムしようとした印刷のhtml：pythonを使って休憩なしにhtmlを印刷するには、beautifulsoup？このようbeautifulsoup使用

load = urllib2.urlopen(url) 
soup = BeautifulSoup(load, 'lxml') 
characteristics = soup.find('table', { 'class' : 'characteristics-table'}) 
print characteristics

はこの取得：

<table class="characteristics-table"> 
<tr class="characteristics alt"> 
<td class="name"> 
Zīmols 
</td> 
<td> 
Emporio Armani</td> 
</tr> 
<tr class="characteristics"> 
<td class="name"> 
<b>Mehānisma tips</b> 
</td> 
<td> 
<b>Mehāniskie automātiskie</b></td> 
</tr>...

をしかし、このような何かが必要です。

<table class="characteristics-table"><tr class="characteristics alt"><td class="name">Zīmols</td><td>...

はどのようにそれを行うには？

出典

2017-10-28 J. Wash

''.join(characteristics.split('\n')) #or \r\n on Windows

出典

2017-10-28 02:51:27 jdoer1997

戻るない： '' .join （characteristics.split（ '\ n'）） TypeError： 'NoneType'オブジェクトは呼び出し可能ではありません –

コードでは、変数特性のタイプは 'bs4.element.Tag'です。上記のaneroidの答えと同じように、最初に文字列に変換する必要があります。そうする： '' .join（str（特性）.split（ '\ n'）） – jdoer1997

あなただけの空の文字列''で改行を置き換えることで、それらを削除するにはstr.replaceを使用し、その後、characteristicsに改行を削除する場合：

print str(characteristics).replace('\n', '').replace('\r\n', '')

最初のものは、UNIXスタイルの改行2つ目を置き換えます最初の結果に適用され、Windowsスタイルの改行を置き換えます。

編集：.replaceは、beautifulsoupのfindから返されたobjのstr()に適用する必要があります。

出典

2017-10-28 02:46:16 aneroid

戻り値：characteristics.replace（ 'の\ n'、 ''）.replace（ '\ R \ n' は、 ''）はTypeError： 'NoneType' オブジェクトが呼び出し可能 –

pythonを使って休憩なしにhtmlを印刷するには、beautifulsoup？このようbeautifulsoup使用

答えて

関連する問題