いくつかのHTMLを解析するためのコードは次のとおりです。出力(html結果)を、エスケープされた文字シーケンス(例えば、\n
)を含む1行のコードとして保存する必要がありますが、単一引用符または出力があるためにrepr()
から使用できない表現を取得しています。その(エスケープシーケンスを解釈する)のように複数行に書き込ま:私は(エスケープシーケンスを含む)が必要です文字列の内容に nを入れて1行に書き込む
<section class="prog__container">
<span class="prog__sub">Title</span>
<p>PEP 336 - Make None Callable</p>
<span class="prog__sub">Description</span>
<p>
<p>
<code>
None
</code>
should be a callable object that when called with any
arguments has no side effect and returns
<code>
None
</code>
.
</p>
</p>
</section>
何:
<section class="prog__container">\n <span class="prog__sub">Title</span>\n <p>PEP 336 - Make None Callable</p>\n <span class="prog__sub">Description</span>\n <p>\n <p>\n <code>\n None\n </code>\n should be a callable object that when called with any\n arguments has no side effect and returns\n <code>\n None\n </code>\n .\n </p>\n </p>\n </section>
マイコード
soup = BeautifulSoup(html, "html.parser")
for match in soup.findAll(['div']):
match.unwrap()
for match in soup.findAll(['a']):
match.unwrap()
html = soup.contents[0]
html = str(html)
html = html.splitlines(True)
html = " ".join(html)
html = re.sub(re.compile("\n"), "\\n", html)
html = repl(html) # my current solution works, but unusable
上記は私の解決ですが、オブジェクト表現は良くありません。文字列表現が必要です。どうすればこれを達成できますか?
これは動作します。最も簡単な解決策として受け入れる – lkdjf0293