2017-11-13 15 views
0

scikitlearnのf1_score avg micro/macro(http://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html)はマルチラベルデータ分類子に基づいていますが、マルチラベルクラスタリングでも同じことができるのだろうかと思っていましたか?マルチラベルクラスタリングにscikitのf1_scoreの平均マクロ/マイクロを使用できますか?

私が扱っているデータは、50.000 timeseries(ts)でscikitのkmeansを使用してクラスタ化されています。だから、私はクラスターで終わる:c1 {ts_1、ts_2 ...}、c2 {ts_20、ts_21 ...}等

それぞれの時系列には、マイクロアレイとマクロのスコアを平均化するためのゴールデンスタンダードとして使用します。クラスターの時系列は、そのラベル(L)で置き換えることができます。c1 {(L_1、L_2)、(L_2)、(L_2)、(L_3、L_4、L_5)...}

can the f1 avgそのようなデータセットのクラスタリングにマイクロとマクロのスコアを適用するか、代わりにそれを見なければならない他のスコアがありますか?

答えて

0

No.クラスタリングでは、独自の「ラベル」(多くの場合、0 ... k)が使用され、分類ラベルには1対1の一致がないためです。

クラスタリングはノーの分類です。相違がかなり重大かもしれないので、 "教師なし分類"という用語は非常に誤解を招きます。だから、クラスタリングの誰もこの用語を使用していないようです。

代わりに、クラスタの評価メトリックを使用してください。

関連する問題