-1

私はいくつかの広告出版社のデータセットを持っています。サイト運営者は広告のクリックごとに収益を得る。データセットは、サイト運営者リストとそれに対応するクリック数および取引数から構成されます。問題は、出版社が不正行為をしてクリックすると、より多くのお金を得るために自分の広告を表示するかどうかです。これらのサイト運営者の一部はクリック数が非常に少ない(10未満)ため、取引件数は0件です。多くのゼロデータを含む不正行為を検出します

私はこれらのゼロデータで何をすべきですか?彼らは実際にガウス分布のデータを破壊してしまいます。私はそれらと何をすべきですか?私のデータセットから削除するだけですか?そのようなことを行う統計的アプローチはありますか?

私は非常にデータ分析に新しいですし、答えが明らかな場合は私に言い訳が、私はWeb上で答えを見つけることができませんでした。

答えて

1

はあなたのガウス分布の形状が変更されます

>>> x = [0,2,0,5,0,6,77,8,9] 
>>> list(filter((0).__ne__, x)) 
[2, 5, 6, 77, 8, 9] 

ゼロのを削除します。

+0

ご返信ありがとうございますが、配信と結果のp(x)は変更されません。 @リチャード –

関連する問題