私は一連のデータを分析しており、その回帰を見つける必要があります。データセット内のデータポイントの数が少なく(〜15)、私はそのジョブに堅牢な線形回帰を使用することに決めました。問題は、手順が、影響力のないような外れ値としていくつかの点を選択していることです。Pythonの統計モデル堅牢な線形回帰(RLM)外れ値の選択
点BとC(図中の赤丸で示されている)が外れ値として選択され、影響の大きい点Aは外れ値として選択されます。ポイントAは回帰の一般的な傾向を変えないが、基本的に最高のXを持つポイントとともに勾配を定義している。ポイントBおよびCは勾配の有意性にのみ影響を与える。だから私の質問には2つの部分があります: 1)最も影響力のあるポイントが選択されていない場合、RLMパッケージの方法を教えてください。 2)あなたは点Aが外れ値だと思いますか?