私はcsvファイルを持っていますが、それは別の機械学習アルゴリズムを使って訓練されるデータを準備しているので、欠落しているデータをその列の平均で置き換えます。最も頻繁に使用されている要素で置き換えるべきかパンダを使ってPythonでそれをやるのが最も簡単な理由は何ですか?カテゴリのデータがありませんpython
コード:
dataset = pd.read_csv('doc.csv')
X = dataset.iloc[:, [2, 4, 5, 6, 7, 9,10 ,11]].values
y = dataset.iloc[:, -1].values
行番号2は、カテゴリデータが含まれています。
最初の行の値:
[3、 'S'、22.0、1、0、7.25、107722、2]あなたの質問のモデリング一部について