問題:テキスト行にテキストが多数含まれています。これでユーザーはいくつかの文字を入力し、与えられたファイル内のテキストに基づいて提案を自動補完する必要があります。 ファイルにcomputer science is fun. computer engineering is awesome
が含まれているとします。 ユーザーがcom
と入力した場合、提案としてcomputer science
とcomputer engineering
とする必要があります。ユーザーがis
と入力した場合、提案はfun
とawesome
である必要があります。ユーザは、テキストファイル内にあるかもしれない単語を入力することができる。単語がファイルにない場合は、提案はありません。テキストファイルからの単語候補のデータ構造
この問題の最適なデータ構造は何でしょうか。
私はトライを作ることができると知っていますが、ユーザーがcom
と入力すると、computer
しか提案できないことがあります。
ありがとうございました。
質問はどのようなデータ構造ではなく、データのモデリング方法です。この問題を解決するために、文字nGramモデルを構築することができます。 – gidim
あなたのトライは単一の言葉ではなく、 –