このような質問がここにあることを願っています。 製造プロセス(センサデータ、プロセスパラメータなど)から収集されたデータがあります。生産ラインからスクラップであるかどうかわかっているすべての部品についてデータがあります。これは私が今扱っている問題です: 私は、それぞれのプロセスデータと品質(0:良い1:悪い)を持っています。あいまいなデータセット
私の目標は、製造プロセスを最適化すること、すなわち最小量のスクラップを生成する最適プロセスパラメータを見つけることです。
私はこれまで何をしましたか:さまざまな分類アルゴリズム(ランダムフォレスト、SVM、ニューラルネットワーク)を試しましたが、どれも良い精度を達成することはできません。 私は、データが非常にあいまいであると考えています。つまり、同じプロセスパラメータを持つ部品がある場合は、それらのうちのいくつかが不良品であるかもしれないが、一部が良品であるかもしれないということです。しかし、品質とプロセスパラメータの間には明確なつながりがあります。 私が今したいのは、ある部分が良いか悪いかの "確率"を予測することです。 Imo確率密度を見積もりたいですか?私はK-最近隣人でこれを行うことはできますか?