こんにちは私はPythonで問題があります。私は私の問題を例で説明しようとしています。python - 正規表現とユニコードの問題
私は、この文字列を持っている:
>>> string = 'ÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿÀÁÂÃ'
>>> print string
ÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿÀÁÂÃ
を、私が試してみました、例えば、 "" と私
をN、A、異なるcharachtersを置き換えたい:
>>> rePat = re.compile('[^ÑÃï]',re.UNICODE)
>>> print rePat.sub("",string)
�Ñ�����������������������������ï�������������������Ã
私はこれを得た。 私はこれが起こっていると思うのは、このタイプの文字列がベクトルの2つの位置で表現されているからです。たとえば\ xc3 \ x91 =Ñです。 これに対して、私がregolar式を作成すると、すべての\ xc3は置き換えられません。どのように私はこのタイプのサブ?????あなたの文字列がUnicode文字列ではなく、プレーンな文字列(プレーン文字列はバイト配列のようなもの)であることを確認する必要があり
おかげ フランコ