x属性とyレコードを持つデータセットがあります。最大x-1個の欠損値を持つ入力レコードがある場合、残りの欠損値のどれを合理的に近似することができますか?データセットが与えられた入力のおおよその値がありません
そこで、以下の例では、入力レコードは(残りは行方不明と、属性2及び6)2つの値を有し、I属性8
Iの値に近似したいです欠損値は「代用」によって処理されていることを知っていますが、私は一般に前処理データセットに関する例を見つけています。私は回帰を使用して欠損値を決定し、理想的には一度構築されたモデルを使用するソリューションを探しています(可能な場合、毎回生成する必要はありません)。
のすべての欠落値のために、世界平均(8.4)を使用するよりも優れています。画像をカットアンドペーストすることはできません。 – G5W