アラビア語のフレーズを対応するユニコード表現の文字列に変換しようとしていますが、アラビア語のテキストに対しては問題ありません。Python:スペースやその他の特別な文字を対応するユニコード表現に変換する
>>> a = ' مساء الخير'
>>> a.strip().decode('utf-8').encode('unicode-escape')
'\\u0645\\u0633\\u0627\\u0621 \\u0627\\u0644\\u062e\\u064a\\u0631'
ただし、スペース文字をユニコード表現( '\ u0020')に変換したい場合もあります。私は '、'、 '、'などのような他の文字と同様の動作を観察しています。最後に、文字列内の各文字のユニコード値をリストとして取得したい(単に現在の文字列を区切り記号 ' uが」私にスペース文字が前のUnicode表現と組み合わせてしまうと、誤ったスプリット)
>>> a.strip().decode('utf-8').encode('unicode-escape').split('\\u')
['', '0645', '0633', '0627', '0621 ', '0627', '0644', '062e', '064a', '0631']
などを提供します。私は現在の[... '0621' ...]の代わりに[... '0621'、 '0020' ...]をしたいです
私はPython文字列エンコーディングには新しいです。この方法でPython文字列をトラバースすることができるかどうかはわかりませんでした。このソリューションは正常に動作します!ありがとう:) – NightFury13