私は 'ä'のようなdevanagriスクリプト文字をそのユニコード表現\u0905
に変換したいと思っています。 以前のpython2.7では、each_character.encode("unicode_escape")
を使用していましたが、ここではeach_character
がdevanagriスクリプト文字を参照しています。 しかし、最近私はpython3の作業を開始しました。上記のスニペットを実行すると、次のエラーが表示されます。python3を使ってシンボルをそれぞれのユニコード表現に変換するには?
expected str instance, bytes found
誰もが自分のUnicode表現にすべての文字を変換する方法を提案することができます。私はdevanagri OCRに取り組んでおり、それらを地上の真理として渡すためには、Unicode表現が必要です。
問題を示すサンプルスクリプトを投稿してください。それは数行にすぎないはずです。 – tdelaney