2017-12-20 39 views
0

現在、上位10種類のフォルトチャートを行っています。したがって、ユーザは、何についての不具合であるかをキー入力します。電球が溶けた。自由な流れのテキストボックスであるので、言葉は同じではないかもしれません。とにかく、いくつかの言葉が同じである可能性があることをアウェアチクスに理解させるために、トップ10のタイプの欠陥を見つけることを可能にするために、そこにはありますか?ありがとうございました。Alteryx単語の類似性を分析する

答えて

0

あなたにはいくつかの方法があります。結合カテゴリのファジーマッチツールを使用して、わずかなスペルミスを整理できます。あなたはYoutubeでファジーマッチのAlteryxの例を見つけることができます。

レコードIDとそれに続くテキストと列(スペースに基づいて分割)を使用して、単一の単語のリストを取得することもできます。

あなたがしようとしていることでは、私はルックアップテーブルのビットを構築することをお勧めします。検索置換ツールを使用して、検索された単語に応じてルックアップからカテゴリを追加することができます。

あなたのデータの清潔さと、各カテゴリがどのように異なっているかによって、上記の道のりのどれくらいまであなたを導いてくれるでしょうか。

関連する問題