PHPでユーザが提出した文字列からウルドゥー語のフレーズを抽出したい。文字列からウルドゥー語/アラビア語のフレーズ/センテンスを抽出する
Array ( [0] => Array ( [0] => دنیا گول ہے [1] => ہے ) [1] => Array ( [0] => آوارہ گرد کی ڈائری [1] => ڈائری ) [2] => Array ( [0] => ابن بطوطہ کے تعاقب میں [1] => میں ) )
でもIかかわら:例えば、$string
は、私は次の出力を得る
In his books (some of which include دنیا گول ہے, آوارہ گرد کی ڈائری, and ابن بطوطہ کے تعاقب میں), Ibn-e-Insha has told amusing stories of his travels.
が含まれている場合など今
$pattern = "#([\x{0600}-\x{06FF}]+\s*)+#u";
if (preg_match_all($pattern, $string, $matches, PREG_SET_ORDER)) {
print_r($matches);
} else {
echo 'No matches.';
}
:このため、私は、次のテストコードを試してみました希望のマッチ(دنیا گول ہے
、آوارہ گرد کی ڈائری
、およびابن بطوطہ کے تعاقب میں
)を取得すると、私は望ましくないものも得ます(ہے
、ڈائری
、およびمیں
- それぞれ実際にはそのフレーズの最後の単語です)。誰も私が望ましくないマッチを避ける方法を指摘していただけますか?
アレイのスニペットは涼しく見えます。 – Skurmedel