私はpython2.7でurduのテキストを使って作業しています。私がやっていることは、テキストファイルを読んで、 "。" 「センテンスマーカーの終わり」ではファイルに置き換えられますが、これを開始位置に配置しています。私は、文の最後にある " - "の場所にマーカーを追加したいと思います。私のコードはここにある:"。"をPythonの<s>に置き換えてください。
import codecs
import re
import sys
import io
fil = codecs.open("aa.txt","r",encoding="utf-8")
fil1 = codecs.open("a.txt","w",encoding="utf-8")
for line in fil:
for ch in line:
ch = ch.replace(u'۔','</s><s>')
fil1.write(ch)
私の元のデータは次のとおりです。
میراناماحمدہے。あなたはپڑھتاہو。置き換えるしようとした後
私のファイルは、次のとおりです。
は親切に私を助けたり、私が何ができるか私を示唆しています。検索してから交換する文字列:
ここで起こっていることは、LTRとRTLとの相互作用です。選択動作を見ると、すべてが正しい順序になりますが、各文がLTRテキストに埋め込まれたRTLフラグメントであるかのように、I _think_がレンダリングされます。下の答えで文字を選択することで、文字が順番に並んでいることがわかります:最初の文、置換テキスト、2番目の文、置換テキストですが、これはLTRのレイアウトです。 – mwchase
@nchchaseどうすればこの問題を解決できますか? – smartF