2017-01-25 24 views
0

クラシファイア、特にマルチクラスクラシファイアに関する研究を行った。私の質問は、精度とリコールを使ってクラシファイアを評価すると、の意味がわからないということです。偽陽性偽陰性の多クラス分類器評価です。マルチクラスクラシファイア評価

たとえば、文書を分類するとき(実際のカテゴリはC-1)、分類器は文書をC-2として分類します。次に、C-2で偽陽性を増やし、C-1で偽陰性を増やすべきですか? (本当の答えはC-1なので)

答えて

0

あなたが与えた例は2つのクラスの問題ですから、あなたの例の文脈では偽陽性と偽陰性を説明しています。 2クラスの場合

、混同行列は、通常、次のようになります。

私が使用した表記は以下を意味
 | Declare C-1 | Declare C-2 | 
|Is C-1| TP  | FN  | 
|Is C-2| FP  | TN  | 

  • TP =真陽性(と分類します実際にC-1である)
  • FN =偽陰性(C-2として分類されるが実際にはC-1)
  • FP =偽陽性
  • TN =真陰性

生データから、テーブル内の値は通常、テストデータに対する各オカレンスのカウントになります。これから、精度、リコールなどの値を計算することができます。

たとえば、次のような表があります。

 | Declare C-1 | Declare C-2 | 
|Is C-1| 12  | 6  | 
|Is C-2|  8  | 11  | 

上記の表は、以下の情報を表す:

  • 12文書はC-1に分類され、それらが実際にC-1に属します。
  • 6件のドキュメントはC-2に分類されていますが、実際はC-1に属しています。
  • 文書はC-1として分類されますが、実際はC-2に属します。
  • 11個の文書はC-2に分類され、実際にはC-2に属します。例えば

    Precision = 11/(11 + 6) 
    Recall = 11/(11 + 8) 
    

    、Iは、文書を分類する場合(その実際のカテゴリがC-1:カテゴリーC-2の

    Precision = 12/(12 + 8) 
    Recall = 12/(12 + 6) 
    

    :カテゴリーC-1

)、分類器はそれをC-2として分類する。次に、C-2で偽陽性を増やし、C-1で偽陰性を増やすべきですか? (実際の答えはC-1であるので。)

あなたは*して以下に示されDeclare C-2Is C-1に関連付けられた混同マトリックスのセル値の数を増やすべきです。

 | Declare C-1 | Declare C-2 | 
|Is C-1|  0  | 0*  | 
|Is C-2|  0  | 0  |