2017-07-14 21 views
1

「トレーニング発話」と「エンドユーザーの入力発言」の両方に対して、次のテキスト前処理タスクを実行することをお勧めしますか?LUIS-bot-appにはテキストの前処理が推奨されていますか?

  1. 「ルート」の同義語に置き換えてください。例えば。 の通常/標準のを「ルート」の同義語の正規表現に置き換えます。これはLUISフレーズリストに似ていますが、自分のアプリの内部リストを定義できます。これは10個のフレーズリストに限定されていません。
  2. ステミング:屈曲した(または時々派生した)単語をそのルートフォームに還元します。例えば、「接続する」、「接続する」、「接続する」、「接続する」、「接続する」という単語は「接続する」にマッピングされる。

...他のテキストの前処理タスクがありませんでしたか?

答えて

0

私がLUISで経験したことは、テキストの前処理を行うことを推奨していないことです。 LUISは、POSタギングを使用した分類方法を使用しています。ルートのステミングや置き換えは、文の意味を変えることがあります。最善の方法は、オリジナルのユーザー作成コンテンツを先に進めることです。

+0

あなたの結論を証明するいくつかの研究を行っていますか?例えば。事前処理_性能なしに/をテストするための相互検証技術を適用する。あるいは、マイクロソフトからのいくつかのリンクで前処理を避けることを推奨しましたか? –

+0

私はチャットボットLUISモデルでこのようなシナリオを経験しました。それは、前処理ステップなしでうまくいった。 –

関連する問題