2011-07-12 17 views
-2

私はPythonの初心者です。私は、 "Regexを使用して検索と置換操作"を行う必要があるHTMLファイルを持っています。これを行う最善の方法は何ですか?Pythonを使用したHTMLファイルの文字列と正規表現の操作

HTMLファイルの内容を文字列として取得できますか?それとも良い方法がありますか?

+2

"これを行うにはどうすればよいですか?"正規表現を使用しないでください。これを行う最善の方法は、(1)ここでこの質問の重複を検索してください。 (2)すべての複製物に対する答えである美しいスープを使用する。 –

+1

-1、今日の3番目のHTML解析+正規表現の質問...質問する前にちょっと調べてください。正規表現を使ってHTML解析を行うと、常に多数のダウンボックスが表示されます。 –

答えて

5

Beautiful SoupのようなHTMLパーサーを見てください。 regexを使用してHTMLを解析すると、a bad ideaとなります。

編集:

美しいスープライセンス:

美しいスープはPython自体と同じ条件の下でライセンスされて

Pythons license

注: GPLと互換性があるというわけではなく、私たちがGPLでPythonを配布しているわけではありません。すべてのPythonライセンスは、GPLと異なり、変更をオープンソースにしなくても、変更されたバージョンを配布することができます。 GPL互換のライセンスは、PythonとGPLの下で公開されている他のソフトウェアとを組み合わせることを可能にします。他はしません。

+0

[html5lib](http://code.google.com/p/html5lib/)も悪い決断ではありません。 – Pill

+0

@cularis私はこのスクリプトを配布用に使用します。だから美しいSoapやhtml5libを使用すると、展開が可能になるでしょうか? – thinkcool

関連する問題