0
私はBeautifulSoupを使用して、htmlファイル内のすべてのカンマを‚
に置き換えています。これは私のコードです:BeautifulSoup htmlファイルを解析するpython
f = open(sys.argv[1],"r")
data = f.read()
soup = BeautifulSoup(data)
comma = re.compile(',')
for t in soup.findAll(text=comma):
t.replaceWith(t.replace(',', '‚'))
このコードは、HTMLファイルにいくつかのJavaScriptが含まれている場合を除いて動作します。その場合、コンマ(、)はjavascriptコードに置き換えられます。これは必須ではない。私は、htmlファイルのすべてのテキストコンテンツを置き換えたいだけです。
クールな...それは素晴らしいです。コメントをスキップするにはどうしたらいいですか? <!Doctype ....>も表示されます。htmlファイルのコメント部分に置き換える必要はありません。 – Divya
もしあなたが '' BeautifulSoup'をインポートしたら、 BeautifulSoup .__ version__を印刷すると、どのバージョン番号が返されますか? –