2016-08-25 8 views
2

私は、300以上のイベントのタイムスタンプ付きイベントシーケンスを処理しています。このデータは、ユーザーがウェブサイトの異なるページを異なる時にヒットしたウェブログに似ています。 1つのシーケンスは1つのWebセッションで、各イベントはユーザーアクション(訪問ページ、クリックボタンなど)です。長さが300以上のシーケンスのTraMineRに推奨されるフォーマットまたはアプローチがありますか?

私は最初にTSE形式を使用しました。 seqefsub()TraMineRハングを使用してサブシーケンスを検索しようとするとき。私はmaxk = 5を設定し、それが働いた(これは5つのイベントに検索するサブシーケンスの長さを制限する)。ただし、maxK 6以上もハングします。なぜこの突然の急降下がわかりません。また、私がイベントシーケンスを整理して、長さが15イベントに過ぎない場合は、すべて正常に完了しました。イベントシーケンスの長さは明らかにここで問題になります。

シーケンスの長さに対してより堅牢な別のフォーマットがありますか? STS? TraMineRでこの長さの配列を処理するための他の推奨事項はありますか?

答えて

1

この問題は、シーケンスの入力に使用されるフォーマットとは関係ありません。

TraMineRには、サブシーケンスを検索するための基本的なアルゴリズムしかありません。

あなたの問題に適したツールを探してみることをお勧めします。たとえば、RパッケージarulesSequencesを考えてみましょう。

+0

これは、より長い配列ではより効果的であるということですか?ありがとう、私はそれを試してみましょう。 – jojo

関連する問題