私はユニコード文字列のリストを持っています。私は、 "\ u"が各文字列要素の部分文字列であるかどうかをテストして、特定のケースに対してアクションを実行したいのですが、これをどうやって行うのですか?" u"がUnicode Python文字列に含まれているかどうかをテストする方法は?
私はPythonでプログラミングしていました。私はPythonで日本語から英語の辞書を持っているので、各文字列の日本語を対応する英語の単語に置き換える予定です。
次の例では、実際には日本語の文字の1つに対応し、もう1つの日本語の文字に対応する\ u539aは一緒に日本語の単語になります。私はこの単語を英語にマップする辞書を持っていますが、今度は "\ u819c \ u539a"を英語の単語に置き換えたいと思います。日本語と英語が混在しているので、まずは純粋なasii文字列かUnicode文字列かを判断します。私はチェックしようとしている理由は、文字列に「\ U」
[u'\u819c\u539a_act', u'wild\u5e45', u'Hello_world', u'hello']
である私は、あなたが行うことができます最も簡単な方法は、Unicode文字列としてすべての文字列を扱うことです
True, True, False, False
:
したがって、上記のコードでは、あなたは出力を生成し、あなたは非漢字を除外することができ
のような何かをした場合:-)あなたの最初の文字列は実際には "u '_ _ _ _' '"であるため、 "\ u"で表されるパターンと一致する方法はありません。 –
まあ、私の推測。私はOP文字列にユニコード文字が含まれているかどうか尋ねていると思いますか? – Saleem
regex – Saleem