2017-01-01 8 views
1

私はデモのためにランカーを作ろうとしています。 は、私が「自動訓練」をやったと私は(より良いかもしれない) 私はマニュアルトレーニングに入るしようとしていますが、私はBluemixオンラインドキュメントからのパラメータの意味について混乱していますOKの結果を得た:https://www.ibm.com/watson/developercloud/doc/retrieve-rank/training_data.shtml#manualwatson検索ランク - マニュアルランキング

でしたいくつかの次のBluemixサンプルデータで説明してください。

query_id, feature1, feature2, feature3,...,ground_truth 
question_id_1, 0.0, 3.4, -900,...,0 
question_id_1, 0.5, -70, 0,...,1 
question_id_1, 0.0, -100, 20,...,3 
... 

query__idとは何ですか? (それは何を表していますか?) feature1、feature2とは何ですか? (それは何を表していますか?) question_id_1は何ですか? (それは何を表していますか?) とそれらのスコアの計算方法(0.0、3.4、-900)?

私はground_truthの値が0から4まででなければならないことを理解しました。(0は意味がありません。

種類は、トレーニングデータをlearning-to-rank(L2R)アルゴリズムを訓練するためのものです ザビエル

答えて

0

について。 L2Rアプローチは、query(別名質問)に応答して生成されたcandidate answersのリスト(検索結果ページ内の文書など)をとり、フィーチャーのセットとしてそれぞれquery-answer pairを表すことです。それぞれの機能は、特定の候補回答がクエリとどのくらいよく一致しているかを表現します。訓練データの各行は、これらの質問 - 回答対のうちの1つに属する特徴値を表す。

トレーニングデータには多数の異なるクエリ(および対応する検索結果)からの特徴ベクトルが含まれているため、最初の列はクエリIDを使用して、単一のクエリに応答して生成されたさまざまな候補回答をまとめます。

あなたが言ったように、最後の列は、人間の注釈者がその答えが実際に質問に関連していると信じているかどうかを簡単にキャプチャします。 0-4スケールは必須ではありません。 0は常に無関係を表します。しかし、その後は、ユースケースに合ったスケールを使用することができます(データが限られている場合には複雑さが軽減されるため、多くの場合、0-1バイナリスケールを使用することがよくあります)。

参照したドキュメントページで入手できるpython scriptは、実際には、さまざまなクエリを含むファイルを指定して候補回答と対応する特徴ベクトルを生成するプロセスを実行します。そのスクリプトのコードをステップ実行して、トレーニングデータをどのように作成するかをよりよく知ることができます。

関連する問題