私は、HTMLの束を持っています。私はBeautifulSoupで解析しています。私は私の現在の出力として、次のシングルが並ぶ文字列に出力を保存したい:BeautifulSoupの空白を取り除く方法
<li><span class="plaincharacterwrap break">
Zazzafooky but one two three!
</span></li>
<li><span class="plaincharacterwrap break">
Zazzafooky2
</span></li>
<li><span class="plaincharacterwrap break">
Zazzafooky3
</span></li>
理想的には私が
<li><span class="plaincharacterwrap break">Zazzafooky but one two three!</span></li><li><span class="plaincharacterwrap break">Zazzafooky2</span></li>
を希望冗長空白の多くは、私がしたいことがあります取り除くのが好きですが、それは必ずしもstrip()
を使用して取り外し可能であるとは限らず、テキストを保持する必要があるため、すべてのスペースを大量に削除することはできません。どうしたらいいですか?正規表現が過度に使用されるという共通の問題のようですが、それが唯一の方法ですか?
私はそこにもう少し強力なことができるので、私は<pre>
タグを持っていません。
ありがとうございました!
? – user225312
あなたは何をブラウザで行うことができます:隣接するすべての空白(テキスト内)を単一のスペースに畳みます。 – delnan