をさらに良いことに、あなたは一部ではありませんいくつかのスペースおよびその他の空白文字の文字を終了した文の後に、先頭の空白文字を受け入れるには、次の構文を使用することができます抽出される文字列の!
[^\s].+?[?!.](?=\s+|$)
制限:例10 B.C.
や他の略語について
- が文として検出されます...のよう
- 文字列:
terkena musibah!Uang saya 90.000 dicuri maling.
は、一つの文として検出されます...
新バージョン:
私は正規表現の限界を解決するために、次のように正規表現を適応し、これまでに提案した:
[^\s.!?][[email protected]#$%^&,;"':*()-_+=/\\|{}><()[\]\s\d]*?([?!]|((?<=[^A-Z])\.(?=[^0-9])))
と私は上のテストにそれを持っています次のテキスト:
Apa ya{ng terjadi? Ak[u +10 B.C. ter,ke]na 10.3 mus}ibah.Uang say\a 90!000 dic&uri ma|ling.
Apa yang te*r(j)adi? Aku terkena mus%ibah! Uang sa^ya 90.000 dicuri maling.
ter;ke|na mus-ibah?uang saya 90..000 dicuri m"aling.
[email protected] mus+ibah!ua=ng say$a 90?000 dicuri ma'ling.
terk\ena mus#ibah.uang saya 90.000 dicuri maling.
Apa yang terjadi? Aku 10 B. C. terke\na mu/sibah.Uang saya 90!000 dicuri maling.
Apa yang terjadi? Aku -10 B. C. terke\na mu/sibah. Uang saya 90!000 dicuri maling.
の
利点:
略語保存されていますAk[u +10 B.C. ter,ke]na 10.3 mus}ibah.
は紀元前を維持し、1文として見られていますterkena musibah!
とUang saya 90.000 dicuri maling.
幸運:
terkena musibah!Uang saya 90.000 dicuri maling.
は文章で分離されます!
はあなたのためにこの仕事をしていますか? '+?[?!](?= | $)' – CAustin
@CAustin、はい、これは本当にうまくいきます。あなたに心から感謝してます。 –