私は自然言語のユーザー入力をキャプチャしており、あらかじめ定義された "正しい"バージョンに対してチェックする必要があります。これは些細なことですが、私は英語での収縮の変化をどのように扱うかについては不明です。英語の収縮をプログラム的に処理する方法[Regex、JS、Ruby]
私は文章を期待しているとします。I'm positive you don't know what you're doing.
マッチは正確である必要がありますが、ユーザーをただ1つのバリエーションにロックしたくないので、欲求不満になります。
だから、その文のすべてのバリエーションを有効な一致として手動で入力する必要がありますか?そうですね:
"I'm positive you don't know what you're doing."
"I am positive you don't know what you're doing."
"I am positive you do not know what you're doing."
"I am positive you do not know what you are doing."
"I'm positive you don't know what you are doing."
...
などです。もっと複雑な文章を考えれば、これがどのように狂っているのか分かります。
または、これを処理できるプログラム的な方法はありますか? Regex、JS、Ruby、Rails(私が使っているツール)を使っていますか?
ご協力いただきありがとうございます。
は何キー単語やフレーズの選択について - 上記のあなたの例ではので、それは次のようになります* *陽性、わからない**と**やっている** – user2182349
なぜあなたは文をチェックする前に単純な正規表現の置換を実行しないのですか? '\ bdo not \ b' =>' don't'、 '\ bI am \ b' =>' I'm'などのようなもの。 –
[Javascriptのファジィ検索は意味をなさない](http:// stackoverflow .com/questions/23305000/javascript-fuzzy-search-that-makes-sense) – guest271314