与えられた文字列からDevanagariテキストを取り出すことができるpythonコードを書いてみたいが、同じものに対してUnicodeを使う方法はわからない。
私の入力は、私だけではないデーヴァナーガリーで書かれたテキストをしたい、このフォームユニコードの助けによって与えられた文字列からDevanagriテキストを取り除く方法
Translate 'अंक'
36 अ [V]
36 ं [n]
57 ं (क [N]
36 क [kV]
---
(hi)'VNk(en)
になることを数字や英語のアルファベット。
私の出力は、このフォーム
である必要があり、私はこのコード
import codecs
file = codecs.open("C:/Users/prince/Desktop/hindi.txt",mode = "r", encoding = "utf-8")
file_dic = codecs.open("C:/Users/prince/Desktop/dic.txt",mode = "w", encoding = "utf-8")
for i in range (0, 330):
u = file.read()
if (u[i] >= 0900) && (u[i]<= 097F):
file_dic.write(u)
file_dic.write(' ')
あなたはより具体的な例として、あなたが試した、おそらくいくつかのサンプルコードを提供することはできますか? – Daenyth
PythonでテキストのUnicode値を使用する方法に関する情報がありませんでした。私は問題のコードを含んでいます。 @Daenyth – Prince