は、ここではいくつかの例です(ユニコード)文字列:ユニコード文字列をPythonでリテラル文字列に変換するには?
a = u'\u03c3\u03c4\u03b7\u03bd \u03a0\u03bb\u03b1\u03c4\u03b5\u03af\u03b1 \u03c4\u03bf\u03c5'
b = u'\u010deprav so mu doma\u010di in strici duhovniki odtegovali denarno pomo\u010d . Kljub temu mu je uspelo'
c = u'sovi\xe9ticas excepto Georgia , inclusive las 3 rep\xfablicas que hab\xedan'
それはこのようになりますように、私の最終目標は、バックスラッシュ(スペース)に分割することです:(
split_a = [u03c3, u03c4, u03b7, u03bd, ,u03a0, u03bb, u03b1, u03c4, u03b5, u03af, u03b1, ,u03c4, u03bf, u03c5]
split_b = ['', 'u010deprav', 'so', 'mu', 'doma', 'u010di', 'in', 'strici', 'duhovniki' odtegovali denarno pomo', 'u010d', '.', 'Kljub', 'temu', 'mu', 'je', 'uspelo']
split_c = ['sovi', 'xe9ticas', 'excepto', 'Georgia', ',', 'inclusive', 'las', '3', 'rep', 'xfablicas', 'que', 'hab', 'xedan']
を空スペースとバックスラッシュの両方がある場所は全く問題ありません)。
は、私はこれを使用して分割しようとすると:
a.split("\\")
この例ではhereが見えましたが、私は文字列リテラル文字列(r
を使用)を作成する必要があると思います。しかし、大規模な文字列をすべてのリテラル文字列に変換する方法はわかりません。
私がそれを検索したとき、私はhereを得ました。しかし、a.encode('latin-1').decode('utf-8')
を実行すると、コンパイラでエラーが発生します。それがスローするエラーは'latin-1' codec can't encode characters in position 0-3: ordinal not in range(256)
です。私はユニコード文字列のリストを取得し、プログラムで反復して文字列リテラルを作成し、バックスラッシュで分割するにはどうすればよいですか?
Pythonのインタープリタ言語であるため、Pythonのインタープリタはエラーをスロー。 – linusg
あなたは私のレベルより少し上だと思うが、情報に感謝する! –