私はスペルチェッカープログラムを作成中です。基本的に私は文字列を個々の単語に分割し、各文字列を比較して辞書にあるかどうかを調べます。私は今、私の問題のような言葉です単語の前後、前後にあるすべてのpuncationsを削除するにはjava regex patternを使用する方法
private final static String PUNC_PREFIX = "^\\p{Punct}+";
private final static String PUNC_SUFFIX = "[\\p{Punct}&&[^']+$]";
private final String fixPrefix(String sendIn) {
sendIn = sendIn.replaceFirst(PUNC_PREFIX, "");
return sendIn;
}
private final String fixSuffix(String sendIn) {
sendIn = sendIn.replaceFirst(PUNC_SUFFIX, "");
return sendIn;
}
...次のコードで単語の前と後の文字列を削除するには、管理...「こんにちは - そこに」、「すべての - 第1」、句読点で区切られた単語...間違って綴られているとマークされています。しかし、技術的にこんにちは、そこに、すべて、最初に、すべての言葉が正しく綴られています...ただそれらの間に句読点があるので、それらを「間違っている」。同時に、私は単語の中のすべての句読点を取り除きたいとは思っていません。なぜなら、「しない」、「できません」、「できません」などの単語には、アポストロフィを正しくマークする必要があるからです綴り。どのように私はこれを解決するためにアプローチする必要がありますか?事前
今すぐ試してみていただき、ありがとうございました。 – livelaughlove