接尾辞ツリーが拡張接尾辞配列よりも優れている場合、私はちょっと知りたいです。接尾辞配列対接尾辞木
Replacing suffix trees with enhanced suffix arraysを読んだ後、私はもうサフィックスツリーを使用する理由はありません。いくつかのメソッドは複雑になることがありますが、接尾辞配列ですべてを行うことができます。接尾辞ツリーで何ができ、同じ複雑さが必要ですが、メモリは少なくて済みます。
surveyも示していますが、接尾辞配列はキャッシュフレンドリであり、キャッシュミスやサフィックスツリーを生成しないため、より高速です(キャッシュは配列の使用状況をはるかによく予測でき、再帰的木構造)。
だから、接尾辞配列よりも接尾辞ツリーを選択する理由は誰にも分かりますか? [OK]を
編集 、あなたはより多くのこれまでのところ、私に教えて知っている場合:
- Suffixarraysが追加(いくつかのパターンマッチングアルゴリズムはSuffixtrees
- 上で高速に実行するオンライン建設
- 許可いけません)オンライン構築のために、それをhd aに保存し、既存の接尾辞ツリーを拡大することができます。 SSDを使用している場合、SSDもすばやく静かでなければなりません。
簡単な実装ですか? –
実際の実装では、サフィックスツリーはメモリの点ではもっと小さくなる可能性があります。 – Justin
@ジャスティン:いいえ、実際には拡張された接尾辞配列はメモリを消費しません。これはリンクされた論文のことです。 –