2013-01-31 12 views
7

私は、Elastic Searchと非SQLのパラダイムが初めてです。 私はESのチュートリアルに従ってきましたが、私が働かせることができなかったことが1つあります。エラスティック・サーチで複数レベルのネストされたフィールドを照会する

次のコード(私はPyESをESとやりとりする)では、ネストされたフィールド(サブジェクト)を持つ単一のドキュメントを作成し、別のネストされたフィールド(概念)が含まれています。

from pyes import * 

conn = ES('127.0.0.1:9200') # Use HTTP 

# Delete and Create a new index. 
conn.indices.delete_index("documents-index") 
conn.create_index("documents-index") 

# Create a single document. 
document = { 
    "docid": 123456789, 
    "title": "This is the doc title.", 
    "description": "This is the doc description.", 
    "datepublished": 2005, 
    "author": ["Joe", "John", "Charles"], 
    "subjects": [{ 
        "subjectname": 'subject1', 
        "subjectid": [210, 311, 1012, 784, 568], 
        "subjectkey": 2, 
        "concepts": [ 
            {"name": "concept1", "score": 75}, 
            {"name": "concept2", "score": 55} 
            ] 
       }, 
       { 
        "subjectname": 'subject2', 
        "subjectid": [111, 300, 141, 457, 748], 
        "subjectkey": 0, 
        "concepts": [ 
            {"name": "concept3", "score": 88}, 
            {"name": "concept4", "score": 55}, 
            {"name": "concept5", "score": 66} 
            ] 
       }], 
    } 


# Define the nested elements. 
mapping1 = { 
      'subjects': { 
       'type': 'nested' 
      } 
     } 
mapping2 = { 
      'concepts': { 
       'type': 'nested' 
      } 
     } 
conn.put_mapping("document", {'properties': mapping1}, ["documents-index"]) 
conn.put_mapping("subjects", {'properties': mapping2}, ["documents-index"]) 


# Insert document in 'documents-index' index. 
conn.index(document, "documents-index", "document", 1) 

# Refresh connection to make queries. 
conn.refresh() 

私は被験者ネストされたフィールド照会することができるよ:

query1 = { 
    "nested": { 
     "path": "subjects", 
     "score_mode": "avg", 
     "query": { 
      "bool": { 
       "must": [ 
        { 
         "text": {"subjects.subjectname": "subject1"} 
        }, 
        { 
         "range": {"subjects.subjectkey": {"gt": 1}} 
        } 
       ] 
      } 
     } 
    } 
} 


results = conn.search(query=query1) 
for r in results: 
    print r # as expected, it returns the entire document. 

を私は概念ネストされたフィールドに基づいてクエリを実行する方法を見つけ出すことはできません。

ES documentation

マルチレベルネスティングは自動的に別のネストされた範囲内に存在する場合 は自動的に(としないルート)関連 ネスティングレベルに一致するように、内側のネストされたクエリで得られた、支持され、検出されたことを意味しますクエリ。

query2 = { 
     "nested": { 
      "path": "concepts", 
      "score_mode": "avg", 
      "query": { 
       "bool": { 
        "must": [ 
         { 
          "text": {"concepts.name": "concept1"} 
         }, 
         { 
          "range": {"concepts.score": {"gt": 0}} 
         } 
        ] 
       } 
      } 
     } 
} 

0の結果が返されました:

だから、私は次の形式を使用してクエリを構築するためにしようと試みました。

私は何が欠落しているのか分かりませんし、2つのレベルの入れ子に基づくクエリの例は見つかりませんでした。

答えて

12

、組み合わせのトーンを試した後、私は最終的にそれが次のクエリを使用してしまった:

query3 = { 
    "nested": { 
     "path": "subjects", 
     "score_mode": "avg", 
     "query": { 
      "bool": { 
       "must": [ 
        { 
         "text": {"subjects.concepts.name": "concept1"} 
        } 
       ] 
      } 
     } 
    } 
} 

ので、ネストされたパス属性(被験者)は、常に同じですネストされた属性レベルに関係なく、クエリ定義では属性のフルパス(subject.concepts.name)を使用しました。

+0

私はブール条件を1つしか使用しないため、より正確なクエリ定義は "query"を使用することになります。{"text":{"subjects.concepts.name": "concept1"}} – JCJS

1

私はこれを個人的に試していないので暗く撮影しましたが、コンセプトへの完全な道筋を試しましたか?

[OK]を
query2 = { 
     "nested": { 
      "path": "subjects.concepts", 
      "score_mode": "avg", 
      "query": { 
       "bool": { 
        "must": [ 
         { 
          "text": {"subjects.concepts.name": "concept1"} 
         }, 
         { 
          "range": {"subjects.concepts.score": {"gt": 0}} 
         } 
        ] 
       } 
      } 
     } 
    } 
+0

私はページをリフレッシュすることなく自分の答えを投稿しましたが、あなたの答えは見えませんでした。 ほとんどの場合、パスの値は「件名」でなければなりません。 – JCJS

0

私はJCJSの答えにいくつか質問があります。なぜあなたのマッピングはこれを好まないはずですか?

mapping = { 
    "subjects": { 
     "type": "nested", 
     "properties": { 
      "concepts": { 
       "type": "nested" 
      } 
     } 
    } 
} 

2つのタイプマッピングを定義しようとすると、おそらく動作しませんが、データはフラットになります。私はそれは、パス属性のfull pathを使用するための不可欠だ

{ 
    "query": { 
     "nested": { 
      "path": "subjects.concepts", 
      "query": { 
       "term": { 
        "name": { 
         "value": "concept1" 
        } 
       } 
      } 
     } 
    } 
} 

...私たちは、このマッピングは、ネストされた使用している場合、クエリは、これを好きなはずです...最後に

..私たちは、ネストされたプロパティにネストされるべきだと思います... termキーではなく、full-pathまたはrelative-pathにすることができます。