1
ヘブライ語のテキストインシデントでは、単語が2つ以上の単語に続いて1文字で識別されています。私はこれらのインスタンスにマッチさせてから、その前の単語に1文字を連結する必要があります。任意のテキストは、その複数の事件を持っているかもしれません: 例:Rで一文字の正規表現操作
texts <- c("שלום חברי צה ל היקרים", "נכון לא נכון קשק ש בבטחון", "צה ל ינצח ")
私はそれを交換する必要があります。
texts <- c("שלום חברי צהל היקרים", "נכון לא נכון קשקש בבטחון", "צהל ינצח ")
が提案
hereから
WiktorStribiżewI @( "(* UTF)\\ S + \\ P {ヘブライ} \\ B(* UCP)"、 "\\ 1"、テキスト、パール= TRUE) '' –
GSUB試しあなたがキャプチャグループを逃したと思う – rock321987
はい、@ rock321987、私は何かを逃したことを知っていた。だから、ディマ、http://ideone.com/RWZfAFをチェックしてください。 –