0
cgi.escapeがありますが、純粋なpythonで実装されているようです。 Djangoのようなほとんどのフレームワークもちょうどいくつかの正規表現を実行しているようです。これは私たちがたくさん行うことなので、できるだけ早くするのが良いでしょう。CでHTMLエンコーディング/エスケープを行う良いpythonモジュールはありますか?
多分、Cの実装はこれの一連の正規表現よりはるかに高速ではありませんか?
cgi.escapeがありますが、純粋なpythonで実装されているようです。 Djangoのようなほとんどのフレームワークもちょうどいくつかの正規表現を実行しているようです。これは私たちがたくさん行うことなので、できるだけ早くするのが良いでしょう。CでHTMLエンコーディング/エスケープを行う良いpythonモジュールはありますか?
多分、Cの実装はこれの一連の正規表現よりはるかに高速ではありませんか?
libxml2に基づくlxmlを参照してください。それは主にXMLライブラリですが、HTML support is availableです。
どういうところですか? CがPythonの正規表現ライブラリより高速かどうか尋ねていますか?これはほとんど自明ではないですか?または、どれくらい早く知りたいのですか?または、URLの正規表現解析がDjangoのボトルネックであるかどうかを知りたいですか?質問はなんですか? –
一連の正規表現を使うのは遅くないだけでなく、間違っている*。 SGMLサブセットを正しく解析することは、100%のケースで正しく行うことは驚くほど困難であり、アドホックな正規表現はその作業に適したツールではありません。 –
&>/"を置き換えるだけで、regexは十分ですが、それでcgi.escapeが使用するプレーンな古いstring.replaceがあります。これまでに目立つようになりました。 – bobince