nグラム(n> 3)(およびその出現頻度)を計算する際の計算上のオーバーヘッドを考慮して、何が使用されているのか疑問に思っています。バイグラムやトリグラムだけでは十分ではないアプリケーションはありますか? もしそうなら、nグラム抽出の最先端技術は何ですか?助言がありますか?私は、次の点に注意しています: A new method of n-gram statistics for large num
SQLデータベースに含まれる大量のデータベース(300アイテム程度)を検索するために、JavaScriptクライアント側でファジー検索を実装しようとしています。私の制約は、データベース上でライブ問合せを実行することができないことです。夜間のバッチ・ジョブでフラット・ファイルとして「索引」を生成する必要があります。だから、このようになりますデシベルで始まる: ID. NAME
1. The Ra