1
私は各ファイルの最初のタグを取得したいHTMLファイルのセットを持っています。ファイルには常にファイルの先頭になる特定のタグがないので、これを行う方法がわかりません。BeautifulSoupでHTMLファイルの最初のタグを見つける
例として、次のスニペットでは、最初のタグは<html>
となります。
<html>
<head>
<title>
insert title here
</title>
</head>
</html>
BeautifulSoup(または別のツール)でこれを達成する方法はありますか?ありがとうございます。
HTMLファイルがある場合は、 '<'で始まる最初の行を探してみませんか? –
私は可能でしたが、ファイルの他の操作にbs4を使用する必要があるため、何かが組み込まれているかどうか疑問に思っていました。 – atarw
すべてのHTML文書の最初のタグが ''なので、あなたの質問は正確には分かりません。 –