私はPythonの初心者です。私は、 "Regexを使用して検索と置換操作"を行う必要があるHTMLファイルを持っています。これを行う最善の方法は何ですか?Pythonを使用したHTMLファイルの文字列と正規表現の操作
HTMLファイルの内容を文字列として取得できますか?それとも良い方法がありますか?
私はPythonの初心者です。私は、 "Regexを使用して検索と置換操作"を行う必要があるHTMLファイルを持っています。これを行う最善の方法は何ですか?Pythonを使用したHTMLファイルの文字列と正規表現の操作
HTMLファイルの内容を文字列として取得できますか?それとも良い方法がありますか?
Beautiful SoupのようなHTMLパーサーを見てください。 regexを使用してHTMLを解析すると、a bad ideaとなります。
編集:
美しいスープライセンス:
美しいスープはPython自体と同じ条件の下でライセンスされて
注: GPLと互換性があるというわけではなく、私たちがGPLでPythonを配布しているわけではありません。すべてのPythonライセンスは、GPLと異なり、変更をオープンソースにしなくても、変更されたバージョンを配布することができます。 GPL互換のライセンスは、PythonとGPLの下で公開されている他のソフトウェアとを組み合わせることを可能にします。他はしません。
"これを行うにはどうすればよいですか?"正規表現を使用しないでください。これを行う最善の方法は、(1)ここでこの質問の重複を検索してください。 (2)すべての複製物に対する答えである美しいスープを使用する。 –
-1、今日の3番目のHTML解析+正規表現の質問...質問する前にちょっと調べてください。正規表現を使ってHTML解析を行うと、常に多数のダウンボックスが表示されます。 –