inverted-index

0熱

2答えて

私は弾性検索のオンラインの決定的なガイドを調べていました。私は、次のリンクで説明した転置インデックスの不変性に疑問があります。 https://www.elastic.co/guide/en/elasticsearch/guide/current/making-text-searchable.html 新しい文書がインデックスに追加されたときにどうなるのか？新しい文書に関連する詳細/メタデータを

0熱

1答えて

Elastic/Luceneは分析されないフィールドで何をしますか？

Elastic/Luceneは解析されないフィールドで何をしますか？それは逆のインデックスまたはそのフィールド値の位置を作成する必要はありません（私は想像する）。値を記録するだけでいいですか？私はそれがまだ1つだけの用語で逆インデックスを作ると思う。そして、その言葉の位置は、フィールドの始めとフィールドの終わりに常に固定されます。それは正確に思われますか？

0熱

2答えて

JavaScript：逆インデックスからテキストを再構築するにはどうすればよいですか？

I持って、次の形式で転置インデックス： { IndexLength: 5, InvertedIndex: { word1: [0, 2, 4], word2: [1, 3] } } JavaScriptを使用して「単語1単語1ワード2ワード2単語1」の文字列にこれを変換する最も効率的な方法は何ですか？

0熱

2答えて

トークン化としてのspacyと元の文書との永続的な関連性を持つPythonの逆インデックス

Pythonで逆インデックスを作成して、偉大なhttps://spacy.io/ライブラリを使用して単語をトークン化したいとします。これは、事前処理を並行して実行する方法と、索引付けの準備が整ったドキュメントの素敵なリストを作成する方法の素晴らしい例です。私はこれまで理解していない何 texts = [u'One document.', u'...', u'Lots of documents']

0熱

1答えて

逆インデックスのアウトオブオーダー値配列の交差を見つけるための優れたデータ構造ですか？

私は逆インデックスを持っています。各トークンは、(document_id, score)というペアのリストにマップされています。各トークンの値リストは降順スコアでソートされるため、最も高いランクの文書が最初に表示されます。残念ながら、ドキュメント内のトークンのコンテキストに基づいてスコアが調整されるため、ソートされたスコアがすべてのトークンに対して同時にソートされることを保証することはできません

-1熱

1答えて

逆インデックスノードの追加語

私はC++を新しくしました。逆索引を作ろうとしていますが、コードを理解できません。私は単語の頻度を数えたいと思う。あなたはこのコードと単語の頻度を数える方法を説明できますか？この問題を解決するために私を助けてください。 class node{ public: node() { clear(); } node(char z) { clear(); } ~node()

1熱

1答えて

逆インデックス形式のluceneを印刷

私の理解によると、Luceneは逆索引を使用しています。私はのLucene 6. XXを使用していますが、私は簡単な方法についてはよく分からないですが、解決策はありませんよりも優れている term1 <doc1, doc100, ..., doc555> term1 <doc1, ..., doc100, ..., do89> term1 <doc3, doc2, doc5, ...> .

0熱

1答えて

CPPデータを後で再利用するためにファイルにダンプする

私は、CPP（マップデータ）に計算データを格納して、後でメモリに直接ロードすることで後で使用できるようにする必要があります。（Pythonのpickleと似ています）これを達成する最も速い方法は何でしょうか。その後

0熱

1答えて

elasticsearchで範囲とフレーズのクエリはどのように機能しますか？

弾性検索で逆インデックスを使用している場合、elasticsearchが範囲クエリとフレーズクエリをサポートできることを知りたいと思います。注：私は逆インデックスがそれらをサポートしているのを見ましたが、私は内部でそれをどうやって行うのかはっきりしていません。

-1熱

2答えて

索引付け（転記）の変更Luceneの構造

私は新しい方法で文書を索引付けするための研究を行っています。具体的には、既存の索引構造を変更して、索引付け技術を試してみたいと思います。例えば、Luceneが索引付け時に用語とDoc IDを保存する索引を逆転させている場合、その構造について、その用語に関する位置や統計などの他の情報を保存するように拡張したいと考えています。どのように私はそのような拡張を作るつもりですか？そのような拡張を行っている