2017-01-17 52 views
1

32GB(メモリ)サーバ上のInfluxDBインスタンスに大量のサブ分株価ダニデータが保存されています。残念ながら私たちは記憶上の問題を抱えています。次のチューニングが行われました。InfluxDBで測定を複数の測定値に分割してメモリパフォーマンスを測定しますか?たとえば、金融株データの株式ティッカーごとに1つの数値

cache_snapshot_memory_size   => 6553600, 
cache_snapshot_write_cold_duration => '1m', 
max_series_per_database   => 10000000, 
cluster_write_timeout    => '10s', 

シリーズの数は約650000で、ほとんど増加しません。

簡体字、私たちのスキーマは、現在入札店や数(インデックス付け)タグに加えて、bidaskbid_volumeask_volume、などのような(非インデックス付き)のフィールドを持つ単一の測定orderbookで価格を尋ねます。すべてが小さいカーディナリティーを持っています(ただし、tickerタグを除く)。

ティッカーごとに1つの注文簿の測定値があった場合、メモリの使用量が少なくなると思いますか? orderbook.aaplorderbook.googlorderbook.abcなど

当面は約300テロありますが、これは数年間で10000にもなります。

データを取得するときは、常にティッカーでフィルタを使用します。

参考文献:

答えて

2

回答:

  • あなたが提案している方法は効果がありません。タグの使用を強くお勧めします。これは、データベースがユーザーがデータをモデル化すると想定する方法です。測定にメタデータを追加すると、アンチパターン

  • 分割まで大幅

あなたのメモリ消費を助けるべきではないユニークな測定を独自のタグです
関連する問題