2016-07-03 8 views
0

差動バッファの原理を本当に理解していません。 主な理由は、新しいタプルをメインストアに挿入することを避けることです。これは、辞書と属性ベクトルの再編成が必要となるためです。しかし、差分バッファに新しい値を挿入する場合、辞書と属性値を再編成する必要があります。どのように差分バッファが性能を向上させるべきか?差動バッファの原理は何ですか

答えて

1

あなたは正しいです。挿入/削除のための辞書の再編成は、差分バッファによって回避される。

差分バッファでは、メインストア内のデータを変更しません。代わりに、有効なフラグを0(偽)に設定して、古いデータセットを識別するだけです。差分バッファ自体では、データはソートされていない辞書で圧縮されます。このため、辞書や属性ベクトルを再編成する必要がないため、新しいデータを簡単に挿入できます。ソートされていない辞書の欠点:範囲の選択はより高価です。

バッファの最大サイズは、メインストアと定期的にマージする必要があります。

https://www.fbi.h-da.de/fileadmin/personal/u.stoerl/BigData-SoSe16/BigData-SoSe16-4-InMemory.pdfページ27~39を参照してください。

関連する問題