次のコードがあります。BeautifulSoupの出力に.strip()の後ろにスペースが含まれています
html = urllib2.urlopen(
'https://ebet.tab.co.nz/results/CHCG-reslt05070400.html').read()
soup = BeautifulSoup(html)
data = soup.findAll('div', {'class' : 'header bold'})
match = re.search('R', data[0].text)
race_title = data[0].text[(match.start()):]
race_title = str(race_title.strip(' \t\n\r'))
print race_title
私は、コンソール画面に乗る出力は
Race 1 PEDIGREE ADVANCE SPRINT
C0
295 m
を下回っている私はストリップがSPRINTとC0の間のスペースのいずれかのタイプを取り除くだろうが、明らかに私は、私は必要な何かが欠けていますと思いましたこの結果を理解するのに役立ちます。それはbs4がユニコードなどの文字列を出力するからですか?
すべてのスペースを削除しますか? – WeaselFox
"レース1 PEDIGREE ADVANCE SPRINT C0 295 m" –
という形式の出力文字列が必要なので、改行を削除しますか? 'race_title.replace(" \ n "、" ")'を使用してください。このすべての情報については、docsを読んでください:http://docs.python.org/library/stdtypes.html – WeaselFox