2017-04-21 10 views
0

私は本当に基本的な質問のような気がしますが、私の人生ではわかりません。Python re.sub()とunicode

私は、国際音声学のアルファベットに変換しているテキストをたくさん持っています。私はre.sub()メソッドをたくさん使用しています。多くの場合、これは文字列型の文字をUnicode型の文字に置き換えることを意味します。例:

for row in responsesIPA: 
    re.sub("3", u"\u0259", row) 

予想される文字列またはバッファです。 Pythonのドキュメントでは、置換の型が検索対象の型と一致する必要があると言われています。 str()を "uu259"の周りに置こうとしましたが、まだタイプエラーが出ています。この交換を行う方法はありますか?

答えて

1

"行"が有効な文字列またはバッファ(str、バイト、ユニコード、読み込み可能なもの)ではないことを伝えている場合は、が何であるかを確認する必要がありますに、print(row)を前に追加してください。

ただ、これが事実であることを証明するために、そうすることは動作します:

import re 
print(re.sub("3", u"\u0259", "12345")) 
+0

はい!すべての "行"は.csvファイルから来ていましたが、私はそれらを文字列に変換しなければならないことは分かりませんでした。それがうまくいった - ありがとう! – bkula