0

データセットに欠損値があっても機能するPythonの機械学習アルゴリズムの実装があるかどうかを知りたいと思います。最初に欠損値を代入するアルゴリズムは望ましくないことに注意してください(私はImputerパッケージを使用してこれを行うことができました)。私は、補完なしでデータセットに欠損値が存在する場合でも動作するアルゴリズムの実装について知りたいと思います。欠損値を代入しないアルゴリズムの実装

+0

私はそのようなアルゴリズムの正確な名前はわかりませんが、そのようなスタイルで意思決定ツリーベースのアルゴリズムを実装できると思います。あなたがバイナリツリーを持っていると仮定しましょう。そして、あなたがいくつかのクラスを得るためにそれをトラバースしています。もしあなたがいくつかのフィーチャの正確な値を知らなければ、この欠損値に基づいていくつかの子ノードを選択する必要があります。可能な解決策を含むことができるノードとしてさらにトラバースする。だからあなたは1つの子ノードではなく、2つの子供ノードを結合したもの(何らかの理由で重み付けされている)であなたの解を探しています –

+2

また、私はそのような藻類の大部分が暗黙的に欠損値を帰すと思います。 –

答えて

0

AFAIK scikit-learnには、前処理を行わずに欠損値を処理できるMLアルゴリズムはありません。 Rはそうする。

関連する問題