2012-03-28 13 views
0

私はSolr MoreLikeを持っています。クエリのデバッグを見ると、クエリが改行文字と一致していることがわかります。Solr MoreLikeこのクエリは改行文字と一致します

ここでクエリの?

MLT Q = is_lesson_id:49029 &スタート= 0 &行= 3 & FL = *、スコア&重量= JSON & FQ = {タグ=サイト!} sm_sitename:(FCM OR BCM OR CCM)& mlt.interestingTerms = &詳細mlt.match.include =偽& mlt.match.offset = 0 & mlt.fl =タイトル、本体& mlt.mintf = 2 & mlt.mindf = 1 & MLT。 minwl = 4 & mlt.boost = true & mlt.qf = title^1000 bodyここで

上& debugQuery =上インデントは=を説明しています:

"interestingTerms":[ 
    "body:rabbit",1.0, 
    "body:bunni",0.8582874, 
    "body:easter",0.7999738, 
    "body: ",0.5719101, 
    "body:ampampnbsp",0.51804715, 
    "body:nbsp",0.36014518], 
"debug":{ 
    "rawquerystring":"is_lesson_id:49029", 
    "querystring":"is_lesson_id:49029", 
    "parsedquery":"body:rabbit body:bunni^0.8582874 
        body:easter^0.7999738    
        body: ^0.5719101 
        body:ampampnbsp^0.51804715 
        body:nbsp^0.36014518", 
    "parsedquery_toString":"body:rabbit 
          body:bunni^0.8582874 
          body:easter^0.7999738 
          body: ^0.5719101 
          body:ampampnbsp^0.51804715 
          body:nbsp^0.36014518", 
    "explain":{ 
"p5zqzz/node/681":"\n0.14956066 = (MATCH) product of:\n 0.44868195 = (MATCH) sum of:\n 0.20911716 = (MATCH) weight(body:bunni^0.8582874 in 327), product of:\n  0.5523649 = queryWeight(body:bunni^0.8582874), product of:\n  0.8582874 = boost\n  6.9227004 = idf(docFreq=116, maxDocs=43690)\n  0.09296464 = queryNorm\n  0.3785852 = (MATCH) fieldWeight(body:bunni in 327), product of:\n  1.0 = tf(termFreq(body:bunni)=1)\n  6.9227004 = idf(docFreq=116, maxDocs=43690)\n  0.0546875 = fieldNorm(field=body, doc=327)\n 0.2395648 = (MATCH) weight(body:easter^0.7999738 in 327), product of:\n  0.4799619 = queryWeight(body:easter^0.7999738), product of:\n  0.7999738 = boost\n  6.453766 = idf(docFreq=186, maxDocs=43690)\n  0.09296464 = queryNorm\n  0.49913296 = (MATCH) fieldWeight(body:easter in 327), product of:\n  1.4142135 = tf(termFreq(body:easter)=2)\n  6.453766 = idf(docFreq=186, maxDocs=43690)\n  0.0546875 = fieldNorm(field=body, doc=327)\n 0.33333334 = coord(2/6)\n", 
"p5zqzz/node/621":"\n0.14027193 = (MATCH) product of:\n 0.42081577 = (MATCH) sum of:\n 0.21124022 = (MATCH) weight(body:bunni^0.8582874 in 328), product of:\n  0.5523649 = queryWeight(body:bunni^0.8582874), product of:\n  0.8582874 = boost\n  6.9227004 = idf(docFreq=116, maxDocs=43690)\n  0.09296464 = queryNorm\n  0.38242877 = (MATCH) fieldWeight(body:bunni in 328), product of:\n  1.4142135 = tf(termFreq(body:bunni)=2)\n  6.9227004 = idf(docFreq=116, maxDocs=43690)\n  0.0390625 = fieldNorm(field=body, doc=328)\n 0.20957555 = (MATCH) weight(body:easter^0.7999738 in 328), product of:\n  0.4799619 = queryWeight(body:easter^0.7999738), product of:\n  0.7999738 = boost\n  6.453766 = idf(docFreq=186, maxDocs=43690)\n  0.09296464 = queryNorm\n  0.4366504 = (MATCH) fieldWeight(body:easter in 328), product of:\n  1.7320508 = tf(termFreq(body:easter)=3)\n  6.453766 = idf(docFreq=186, maxDocs=43690)\n  0.0390625 = fieldNorm(field=body, doc=328)\n 0.33333334 = coord(2/6)\n", 
"p5zqzz/node/1204":"\n0.10955032 = (MATCH) product of:\n 0.32865095 = (MATCH) sum of:\n 0.10455858 = (MATCH) weight(body:bunni^0.8582874 in 432), product of:\n  0.5523649 = queryWeight(body:bunni^0.8582874), product of:\n  0.8582874 = boost\n  6.9227004 = idf(docFreq=116, maxDocs=43690)\n  0.09296464 = queryNorm\n  0.1892926 = (MATCH) fieldWeight(body:bunni in 432), product of:\n  1.0 = tf(termFreq(body:bunni)=1)\n  6.9227004 = idf(docFreq=116, maxDocs=43690)\n  0.02734375 = fieldNorm(field=body, doc=432)\n 0.22409238 = (MATCH) weight(body:easter^0.7999738 in 432), product of:\n  0.4799619 = queryWeight(body:easter^0.7999738), product of:\n  0.7999738 = boost\n  6.453766 = idf(docFreq=186, maxDocs=43690)\n  0.09296464 = queryNorm\n  0.46689618 = (MATCH) fieldWeight(body:easter in 432), product of:\n  2.6457512 = tf(termFreq(body:easter)=7)\n  6.453766 = idf(docFreq=186, maxDocs=43690)\n  0.02734375 = fieldNorm(field=body, doc=432)\n 0.33333334 = coord(2/6)\n"}, 
    "filter_queries":["{!tag=sites}sm_sitename:(FCM OR BCM OR CCM)"], 
    "parsed_filter_queries":["sm_sitename:FCM sm_sitename:BCM sm_sitename:CCM"]}} 

は、サーバー上の設定ミスのこの指標である、またはコンテンツが不正にインデックス付けされている、またはクエリを変更する必要がありますか?

答えて

1

HTMLのインデックスを作成していますか?フィルタパイプラインの先頭にあるHTMLマークアップをテキストから取り除きたい場合があります。詳細については、このページのHtmlStripCharFilterを参照してください。http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.HTMLStripCharFilterFactory

+0

クエリアナライザのテキストフィールドに使用できますか? – ebeyrent

+0

クエリパーサーはトークナイザまたは文字フィルタを使用しないため、フォーマットを外してからSolrに送信する必要があります。それらが ' 'のような単なるエンティティの場合、おそらくあなたのプログラミング言語で利用可能なアンエスケープライブラリ関数があります。 –

+0

ありがとうございました!私はHTMLStripCharFilterFactoryをクエリとインデックスアナライザの両方に追加してしまいました。そのため、エスケープされていない生のHTMLをインデックス化できます。私の検索クエリは、MLTクエリでこのフィールドを使用します。 – ebeyrent

関連する問題