分類問題で離散データと連続データをどのように扱うかについての方法論やアイデアがあるかどうかを質問します。機械学習:離散データと連続データを一緒に扱う方法
私の状況では、個別のデータを持つ独立した「バッチ」がたくさんあります。これはプロセス関連のデータなので、バッチごとに別々のポイントがあります。私は同じバッチで時間とともに変化するデータセットも持っています。今度は、すべてのバッチに多くの時間観測があります。データセットは以下のようになります。
Data Set 1
Batch 1 DiscreteInfo(1) DiscreteInfo(2) ....... DiscreteInfo(n)
Batch 2 DiscreteInfo(1) DiscreteInfo(2) ....... DiscreteInfo(n)
Batch 3 DiscreteInfo(1) DiscreteInfo(2) ....... DiscreteInfo(n)
Batch 4 DiscreteInfo(1) DiscreteInfo(2) ....... DiscreteInfo(n)
Data Set 2
Batch 1 t(1) TimeData
Batch 1 t(2) TimeData
Batch 1 t(3) TimeData
Batch 1 t(4) TimeData
.
.
.
.
Batch n (t1) TimeData
Batch n (t2) TimeData
Batch n (t3) TimeData
私はこのすべてのデータが「良い」バッチ、「悪い」バッチ、または「まあまあ」バッチに属しているかどうかを分類しようとしています。これは、特定の個別パラメータ(データセットでは使用されていない)によって決まります。
私は機械学習にはとても新しいです。任意の入力またはアイデアが評価されます。私はこの問題に取り組むためにmatlabの分類学習者を使用しています。
データは私の質問のように構造化されています。私は実際には例のデータセットを与えることはできません。私は情報を共有することは許されていないと思うからです。 基本的に、2つのデータテーブルがあります。 1つは、クラス値とさまざまな別個の情報(通常、処理中に書き込まれ、バッチごとに1回だけ書き込まれるもの)を含む個別のテーブルです。別のデータテーブルでは、各バッチに属するすべての時間変動データがあります(1バッチあたり約1300行の情報、時刻tの温度のようなものです)。 – user3479118
温度データが分類に役立つ重要な情報であると考えるこれらの変数を使用すると、データは1つのテーブルに格納され、今では使用することができるようになります。任意の標準的な機械学習アルゴリズム。 –