詳細情報が役立ちます。 しかし、私はそれらの文字をPythonでどのように使うかを教えてくれます。 このメソッドは、すべてのUnicode文字に対して機能するはずです。
短い回答: テキストに挿入する文字のUnicodeコードを識別します。 あなたはthis siteを見ることができます(エチオピアサブセットはすでに見つかりました)。
各文字に2つのコード(UnicodeとHTML)がありますが、明らかにUnicode(U + ...)が必要です たとえば、sillable 'ha'のコードはU + 1200です。 Pythonでそれらを参照する必要があります: '\ u1200'(見ることができるように '+'記号はありません)。
例。テキストファイル(UTF-8にしたい)のエンコーディングにも注意することが重要です。これは私が同じ文字のためにやったことです:
x = '\u1200'
with open ('text.txt', encoding='utf-8', mode='w') as text_file:
text_file.write(x)
わからないあなたは常にエンコーディングを指定する必要がある場合、私は安全側にすることにしました!
P.S.
'The Ethiopic sillable Ha: \u1200'
・ホープ、このことができます:あなたのような長い文字列でもユニコードcaractersを参照するこの方法を使用することができます言及する価値!
どのようにExcelファイルを読み込みますか?疑問符はどこに正確に表示されますか?それ以上のことが分からなければ、Pythonで問題が起こっていることさえ知ることさえできません。あなたの端末。 – nnnmmm
疑問符は、ethiopic文字を含む「名前」フィールドを持つ1つの列のすべてのテキストと同様に、列名にあります。私もその質問を編集しました。どうやら、pandasはフィールド名を出力しますが、すべての数値データとテキストデータに対してNaNを返します。 – Kaleab
excel(csv)ファイルを 'raw_data = 'hidar_2010.csv''として読んでいます – Kaleab