スパーク - 評価の問題 - 優秀な図書館

私が作成したモデルを評価しようとしています。モデルは出力、idsのリスト、およびそれらの対応するエラー構成（スコア）を与え、idはこのスコアに応じてソートされます。 idが疑わしいほどスコアが高いほどそうだとします。スパーク - 評価の問題

例：

ids: t4, c1, s3, d5, a2, ... 
score: 18, 15, 13, 5, 2, ...

はまた、私は本当の不審なIDが含まれている別のリストを持っています。

suspicious: c1,d5

私の目標は、私の疑わしいリスト内のIDのx％はスコアリストのトップのy％であると言うことができるようにすることです。

ご意見くださいか？スパークの実装はあなたから寛大であるでしょう！ここ

2017-08-11 xiaomai

はパンダのデータフレームを使用して、私がやったことです：

2017-08-18 23:54:04 xiaomai

スパーク - 評価の問題