0

4クラスの分類問題のために、(すでに訓練された)4つの分類器が利用可能です。与えられたデータセットについて、それぞれの分類子の出力と、それぞれのクラスのRecall、Precision、およびF1-得点があります。F1スコアに基づいて分類器の出力を組み合わせる

特定のクラスのいくつかの分類子が他の分類よりも高いf1スコアを有することを考慮して、これらの分類子の予測を組み合わせて1つの最終的な予測を得る最良のアルゴリズム(または既存のアルゴリズム)

EDITは私の主な問題は、いくつかの分類は、特定のクラスのためのより良いF1を持っているということです。

それでは、クラスAを予測し、クラスBの予測クラスA.そしてClassifier2(C2)のために0.90のF1を有し、そしてクラスB

マイ最初に0.80のF1を有するClassifier1(C1)としましょうより高いf1に基づいてC1予測を選択することが考えられるが、例えばC2がクラスAに対して0.999のf1スコアを有することも知っていればどうだろうか? C2がクラスAを予測するのが良い(C1よりも良い)が、それを予測しなかった場合、それは本当のクラスがAではない確率を増やすはずだ。

C2がAクラスのf1が本当に低い場合は、C1がAを予測しているだけでなく、C2も同じであるため、実際のクラスがAである可能性がさらに高くなります。なぜそれがそれを検出することができなかったかもしれないかを説明するクラスを予測することは良くありません

私は実際にこれらの質問にどう対処するか分かりません。

+0

詳細が必要です。 4つの分類器は1対すべてのアプローチで動作しますか?つまり、サンプルが特定のクラスに属しているかどうかを予測するためにのみ使用されます。または、それらはすべて4つのクラスすべてから個々に予測されますか?いくつかのサンプルコードとデータ入力出力が優先されます。 –

+0

すべての分類器はすべてのクラスを個別に予測しました(私たちは異なる名前付きエンティティ認識ツールキットについて話していますので、コードは提供できません)。現在、私はこれらのツールキットのそれぞれの出力だけを扱っていますので、何らかの方法で出力を組み合わせてパフォーマンスを向上させることができる投票システムが必要です。私はすでに働いていたいくつかのアイデアを思いつきました、私はちょうどこれを行うためのアートの方法のいくつかの多分存在を探していた –

+0

@VivekKumar私は私が探しているものをより良く説明しようとする特定の状況の例を追加しましたfor –

答えて

0

f1スコアが最も高い分類器からの投票が最も高い重み付けを持つ待機投票を行う方法もあります。それから、最高得点のクラスを選んだだけです。

+0

問題は、各分類器が各クラスに対して異なるF1を持つことです。私は私の問題のより具体的な例で私の質問を編集した –

関連する問題