MoreLikeThis Solrの機能を使用して、他のドキュメントに基づいて類似のドキュメントを検索しようとしていますが、この機能の仕組みがわかりません。SolrのTermベクトル
hereというと、MoreLikeThisコンポーネントは、termVectors
が保存されているときに最も効果的です。そして、私の混乱がここに来る。
フィールドにフラグtermVectors
を有効にするだけで十分ですか(ソーラーのschema.xmlファイルにフィールドにムービーレビューテキストが含まれているとします)。それを挿入して保存した後、計算されたtermVectorsをMoreLikeThisハンドラへの呼び出しで使用すると、Solrは与えられたフィールドのtermVectorsを計算しますか?
を私は実際にはまだスキーマを持っていない、また私は、のインデックス付きセットを持っています資料。私のソルのコアは今は空白です、私はちょうど始まっています。それで、私がよく理解していれば、Solrはインデックス作成時に各文書の用語ベクトルを自動的に作成します。 – wookie
実際、スキーマで構成した後、Solrはインデックス作成時に注意し、データ構造を構築します。 MLTは自動的に構造体を使用します(内部的には、インデックスファイルのチェックを行います。評価するフィールドの用語ベクトルを見つけた場合は、自動的に使用します) –
素晴らしいことです。実際にもう1つ質問があります。トピックをよく理解していることがわかります。 MLTを実行するとき、インデックス付きドキュメントの限定されたサブセットのみを考慮したいと考えています。たとえば、インデックスが150,000です。スキーマはid、title、contentおよびpublicationDateで構成されます。 ここでは、任意の入力ドキュメントに対してMLTクエリを実行したいと思いますが、02-01-2014と02-04-2014の間にpublicationDateのドキュメントのみを考慮するクエリが必要です。 'mlt.qf'のようなものがその解決策だと思いますか? – wookie