の他の時系列イベントやプロパティに基づいてイベントを予測するモデルを作成します。、私は次のようなデータを持っているオブジェクト
- をする人の識別子
- 日の場所に(まで1から始まり、実行されます当時ヶ月でイベント)
- 人の年齢(場所に日があまりにも増えるように、これは増加)。
- スモーカー(ブール値)、これは決して起こらないかもしれイベントである、または中に複数回発生する可能性が秋(ブール値)
- 時間をかけて変更されません、私たちの場合
- セックスに時間をかけて変更されません特定の人のための完全な期間
- 傷の数:(これは0から8に行くことができます)、傷はすぐにほとんど治癒しませんので、一定期間はほとんど開いたままになります
- イベントをしたい(boolean)を予測する、人の最後の行のみがこの
私は(一人あたり1000のレコードについて、平均で合計1500000の記録にそう)1500人のためにこのデータを持っています。いくつかの人々のために、私が予測したいイベントは数日後に、10年後にはいくつかのために行われます。データセット内の全員がイベントが発生するので、特定の識別子の最後のレコードは、常に1と予測したいイベントを持ちます。
私はこれまでに見つかったすべてのドキュメント複数の人物や物の時系列を示すものではありません。たとえば、機械学習スタジオでデータを分割する場合、同じ人物の記録を一緒に保存したいと考えています。
モデルに新しいレコードを訓練した後、システムにフィードすることは可能でしょうか?それを通過する日ごとに、今後5日間に起こるイベントの見積もりが得られますか?
編集:2名のサンプルデータ:http://pastebin.com/KU4bjKwJ
サンプルデータセットのチャンクを追加できますか?あなたはあまりにも予測しようとしている機能に言及してください。 –
2人のサンプルデータで質問を更新しました。 – rept