2016-03-22 10 views
0

私は特定の政府関連の問題に対してユーザーの苦情を登録するアンドロイドアプリを構築しています。自分のデータベースに曖昧さがなく、苦情をユニークにしたいと思っています。私はPHPとmysqlデータベースを使用しています。同じ苦情を取り除き、ユーザーに提案の編集を与えるために、wordnetのようなソフトウェアを使用して苦情の類似点を一致させたいと思います。だから私はこれをどのようにすることができますか?ワードネットまたはその他の信頼できる方法だけがありますか?文字列間の類似性を比較するための推奨システムを構築する

+1

文字列距離アルゴリズムを使用して、潜在的な新しいエントリが既存のエントリとどれだけ離れているかを計算します。ここから開始してください:https://en.wikipedia.org/wiki/Damerau%E2%80%93%E3%83Levenshtein_distance – JLB

+0

このアルゴリズムは2つの文字列間の同義語を予測しますか?私はすぐに仕事を終えることができるように、私はそれのためのツールを持っている場合は、より正確です。それを実装するには長い時間がかかるようです。 – vicky

+0

あなたがしようとしていることについてのディスカッション:http://stackoverflow.com/questions/12094326/match-similar-variations-of-words-suffixes-in-mysql – JLB

答えて

0

推奨事項(ビルドしている種類ではなく、要求している種類)はスタックオーバーフローでは許可されません。この質問はクローズされると思います。それが起こる前に私はこれを終えることができればうれしい。

単一のケースや曖昧さは、あなたが取り除きたいもののように見えますが、人々がと言っているすべてのことを記録するには、多くの価値があります。です。これはスタックオーバーフローでも当てはまりますが、質問は重複として閉じられるかもしれませんが、私たちはそれらを削除しないので、誰かがこのような質問をここに入力してGoogleからここに到着すると、問題。

あなたが直面している問題は、アルゴリズムよりも製品設計の方が重要です。類似性を判断するために選択したマッチングアルゴリズムにかかわらず、多くの類似性を宣言する効果がユーザーに及ぼす影響は決まっています。それはおそらく類似性を判断する方法の決定を導くでしょう。

類似性を選択して、特定の問題に遭遇したら、あなたが望む効果を得ることができます(つまり、あなたの入力内容とあなたが期待するものを記述することができます。出力)、それはあなたがここで聞くことができる種類の質問です。

関連する問題