2016-05-17 16 views
1

スペルミス検出タスクでは、Python 3.5のレキシコンにデータ構造marisa_triesを使用します。 marisa_trieに要素を追加する方法Marisa Trieに要素を追加する

ショート質問

コンテキスト
考え方は次のとおりです。言葉は私の辞書にある場合、それは正しいです。さて、もしそれが私の辞書にないのなら、それはおそらく間違っています。しかし、私は文書全体の単語の頻度を計算しました。単語の頻度が十分高い場合は、頻繁に正しいと考えて、この単語を保存したいと思います。 その場合、この新しい単語を私のmarisa_trie.Trieレキシコンに追加するにはどうすればいいですか? (毎回新しいトライを作る必要はありません)?

ありがとうございました:)

答えて

2

marisa_trie.Trieは不変トライを実装しますので、あなたの質問への答えは:それは不可能です。

datrieという類似のPythonパッケージを使用して、修正や比較的高速なクエリをサポートすることもできます(PyPIページには、組み込みのdictに対するベンチマークが記載されています)。

+0

ありがとうございます。 'datrie'を見てみましょう:) – Arnaud

関連する問題