2016-12-10 4 views
0

10個のカテゴリごとに〜30個のアイテムを持つモデルを作成したとします。私は私に提供されたすべてのデフォルトを取ってきました。複数のカテゴリを持つモデルに対して予測を実行すると、スコアはすべてのカテゴリに分割されますか?

モデルの平均F1スコアは0.875です(私は2つのカテゴリが非常に密接に関連しているので、精度が少し悪くなります)。

私は、カテゴリ3と8のために積極的に一致している必要があり、テキストの一部のリアルタイム予測を行う場合、私はこの結果を得る:

{ 
    "Prediction": { 
     "details": { 
      "Algorithm": "SGD", 
      "PredictiveModelType": "MULTICLASS" 
     }, 
     "predictedLabel": "8", 
     "predictedScores": { 
      "1": 0.002642059000208974, 
      "2": 0.010648942552506924, 
      "3": 0.41401588916778564, 
      "4": 0.02918998710811138, 
      "5": 0.008376320824027061, 
      "6": 0.009010250680148602, 
      "7": 0.006029266398400068, 
      "8": 0.4628857374191284, 
      "9": 0.04102163389325142, 
      "10": 0.01617990992963314 
     } 
    } 
} 

私は思ったんだけど、何が両方3 & 8かどうかであります効果的に約80%の確実性を持っていたが、両者が一致していたために確実性が2つに分かれた。合計でpredictedScoresを合計すると、.999999997が得られます。使用可能なカテゴリに合計1.0のスコアが割り振られているかどうか質問しています...

代わりに10種類のモデルを設定し、それらのそれぞれと独立して一致すると、3 & 8が高いスコアを持つことが分かりますか?

私は本当に答えは必要ないが、全体的な質問を明確にするのに役立つかもしれないと思います...もし10個のカテゴリすべてに当てはまる理論的なテキストがあれば、Amazon Machine Learningは各カテゴリの値はpredictedScoreです。または、最大predictedScoreが1.0であるため、各カテゴリに対して0.1を返しますか?

答えて

2

Amazon MLは入力セットから既知の各カテゴリの確率を返します。真のモデル化された確率であるため、合計は1になる必要があります。言い換えると、「利用可能な各カテゴリに合計1.0のスコアが割り振られています...」と書かれていると正しいと言えます。

これといくつかのその他の質問に答えるリファレンスページ: http://docs.aws.amazon.com/machine-learning/latest/dg/reading-the-batchprediction-output-files.html#interpreting-the-contents-of-batch-prediction-files-for-a-multiclass-classification-ml-model

関連する問題