私はGoogleと同じような検索クエリをトークン化することを検討しています。私は、次の検索クエリを持っている場合たとえば、:Googleのような検索クエリトークン化と文字列分割
the
quick
brown fox
jumps
over
the
lazy dog
あなたが見ることができるように、トークンは中でスペースを維持:
the quick "brown fox" jumps over the "lazy dog"
は、私は、次のトークンを持つ文字列配列を持っていると思います二重引用符。
私はC#でこれを行う方法の例を探していますが、できれば正規表現を使用しないことをお勧めします。
また、これを拡張して他の特殊文字を扱う方法を知りたいと思います。たとえば、検索クエリからの除外などを強制する用語の前に - を付けます。このような文字列をcharで
、二重引用符( ")がマルチワードトークンを示す以外にも他の場所で使用することができますか?私の目的のために –
、いいえ、それはできません。 – jamesaharvey