私はPythonのData Scienceに関する本を読んでいます。著者は、シグマクリッピング操作を適用して、タイプミスのために異常値を削除します。しかし、プロセスは全く説明されていません。シグマクリッピングとは何ですか?どのようにそれを適用するかを知っていますか?
シグマクリッピングとは何ですか?特定のデータ(例えば、米国の出生率に使用されている書籍の中など)にのみ適用できますか?
quartiles = np.percentile(births['births'], [25, 50, 75]) #so we find the 25th, 50th, and 75th percentiles
mu = quartiles[1] #we set mu = 50th percentile
sig = 0.74 * (quartiles[2] - quartiles[0]) #???
This final line is a robust estimate of the sample mean, where the 0.74 comes
from the interquartile range of a Gaussian distribution.
なぜ0.74:テキストを1として
?これについての証拠はありますか?
https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.stats.sigmaclip.html – DyZ
あなたの回答は役に立ちません。あなたは上記の質問を読んだことがありますか? – NRH
大きく異なる質問が混在しています。 *シグマクリッピングとは何ですか?*上記のリンクで完璧に答えられています。 * 0.74?と引用された本のテキストは、シグマのクリッピングとは何の関係もなく、以下のように答えられます。 – kazemakase