私は、エラーログとその説明の何千もの行を持つデータベースを持っています。このエラーログは24時間365日稼働しているアプリケーション用です。私はダッシュボード/ UIを作成して、プロクシションサポートのために起こっている現在の一般的なエラーを表示したいと考えています。文の間の類似点の計算
私が抱えている問題は、一般的なエラーが多いにもかかわらず、エラーの説明が、転写IDまたはユーザーID、またはそのような固有の特質であることによって異なります。
例えばエラーtrasaction XYZは 例えば2エラーtrasaction XYZは、ユーザ567
私が同じになるように、これらの2 errosを検討するために失敗したユーザ233に失敗しました。だから私は、新しいエラーログを通過し、それらをグループに分類するプログラムにしたい。私は "編集距離"を使用しようとしていますが、非常に遅いです。私はalraedy古いエラーログを持っているので、私もその情報を使用してソリューションを考えようとしています。何かご意見は?
soundexに基づくものはおそらく... –