以下のようなデータがあるとします。オフィスデータマイニングの状況
ための準備Brakfast11:10 user1が食べる朝食
11:15 USER1風呂に入る
11:30 user1の休暇USER1
11AM user1のブラシ
11:05
12pm user2ブラシ
1準備Brakfast
User2が朝食
12:15 user2のお風呂に
を取り12:30 user2のオフィス放置
11AMのユーザー3テイク風呂
11を食べる12:10 user2の14:05 :05AM user3準備Brakfast
11:10 AM user3ブラシ
USER3朝食を食べる11:30がUSER3 12PMが
12:05
準備Brakfast USER4 12:10 USER4ブラシ風呂に入るUSER4
オフィス放置
11:15 12:15 PM user4 eat朝食
12:30 PM user4出勤
このデータは、さまざまな人々の日課について教えてくれます。このデータから、user1とuser2は同様に動作しているようです(アクティビティを実行する時間に違いがありますが、同じシーケンスに従っています)。同じ理由で、User3とUser4は同様に動作します。 このようなユーザーをさまざまなグループに分類する必要があります。この例では、group1-user1とUSer2 ... user3とuser4を含むgroup2が続きます。
このような状況にはどうしたらいいでしょうか。私はデータマイニングを学ぼうとしています。これはデータマイニングの問題として考えていた例です。私は解決策のためのアプローチを見つけようとしていますが、私はそれを考えることはできません。私はこのデータにパターンがあると信じています。私はそれを明らかにする方法について考えることができません。 また、このアプローチを私が持っているデータセットにマップする必要があります。これはかなり大きいですが、これに似ています:)データは、一度にイベントの発生を示すログに関するものです。そして私は類似の一連の出来事を表すグループを見つけたいと思っています。
何か指摘していただければ幸いです。
ありがとうございます。私はあなたが説明したことを得たと思います。あなたが説明したようなクラスタリングを行うことをお勧めします。私はそれに取り組むでしょう。ありがとうございます。 – user722856