これは他の言語でこれを行うことに関する投稿がたくさんあるようですが、Pythonでどうやって(私は2.7を使っていますか)わかりません。Pythonで特定のユニコード文字を置き換えたり削除したりする
明確にするために、私は理想的には、特定の特定の文字を置き換えることができるだけで、ユニコードで文字列を保持したいと思います。例えば
:
thisToken = u'tandh\u2013bm'
print(thisToken)
は、中央のMダッシュ付き単語を印刷します。私はちょうどmダッシュを削除したいと思います。 (しかしはインデックスを使用していない、私はこれらの特定の文字を見つけるこれのどこを行うことができるようにしたいので。)
私は他の文字とあなたのようなreplace
を考えてみてください:
newToke = thisToken.replace('\u2013','')
print(newToke)
それちょうど動作しません。どんな助けも大歓迎です。 Seth
は、すべての文字列リテラルは自動的にユニコードであり、それがここに役立っているだろう(しかし、いくつかの文字列がバイトする必要があるとき、驚きのためにあなたを見て使用することができます彼らのための 'b'接頭辞)。 – RemcoGerlich