0
2つの文字列を比較する必要があります。 aa
はPDFファイル(pdfminer/chardetを使用)から抽出され、bb
はキーボード入力です。コンパウンドを作るために最初の文字列を正規化するにはどうすればよいですか?Python 3のUnicode文字列を正規化する方法
>>> aa = "ā"
>>> bb = "ā"
>>> aa == bb
False
>>>
>>> aa.encode('utf-8')
b'\xc4\x81'
>>> bb.encode('utf-8')
b'a\xcc\x84'