ヘブライ語と英語の巨大な文字列がありますが、ヘブライ語の文字列のみを抽出したいのですが、ヘブライ語で動作する正規表現の例は見つかりませんでした。ヘブライ語と英語の文字列の間の区切り
私はすべての文字を比較する愚かな方法で試してみました:
import string
data = []
for s in slist:
found = False
for c in string.ascii_letters:
if c in s:
found = True
if not found:
data.append(s)
をそして、それは動作しますが、それは、もちろん非常に遅く、私のリストは巨大です。 これより、はるかに高速だったstring.ascii_letters
に文字列の最初の文字だけを比較しようとしましたが、英語の文字で始まる文字列を除外し、そこに "混在した"文字列を残しています。私はヘブライ語の "純粋な"ものだけを求めます。
これはもっとうまくいくと確信しています...助け、誰ですか?
PS:私はPythonプログラムの中でそれを行うことを好むが、同じことをgrepコマンドでもこの1つは動作するはず
あなたの編集版がトリックをしました、ありがとうございました! –