私たちの会社は、大量のラボセンサーデータを保持するファイル形式をしばらく見てきました。彼らは計測を実行するたびに、ファイルを生成します。このファイルは、傾向分析のためにデータベースに保存しています。データを「グループ化」することができるので、階層形式が好まれます。これはデータをデータベースに入れる前の中間ファイル形式です。私たちの開発環境のために、これは私たちの優先リストです:.Netファイル形式?
1).Netに準拠しています。このAPIは、Webサービスとクライアントアプリケーションで使用されます。私たちは顧客の環境を支配していないので、pure.Netソリューションが最適です。
2)読み込み速度。私たちの読書は、逐次ではなくランダムです。速いほど良い。私たちがC#開発の店でなければ、速度は#1だと言います。
3)ファイルサイズ。ファイル自体が大きい場合、良好な圧縮率(86%以上)が望ましい。
4)読み取りのメモリフットプリント。大量のデータがあるため、単に読むことができません。各センサは時間/値の対を有する。これにより、4百万以上のペアが生成されます。これによりXMLが削除されました。
私たちは現在、HDF5を見て、APIがひどく.NETの分野で欠けていること、Webサービスを行うことができないこと、サイズ/スピードを求めていることを発見しました。私もJSONを見ていると有望そうだが、データの一部を読み返すことはしていない。私はウェブを検索し、私たちが必要とする多くのファイル形式を見つけられませんでした。どんな助けもありがとうございます。
ありがとう私は概念の証明を試して、それがどのように動作するかを見ていきます。間違いなく有望です。 – mcauthorn
すべての初期テストとデモから、HDF5と同じ読み書き速度でも圧縮はできませんが(10%少なくなります)、再生することで同じデータを小さなファイルサイズで取得できました。推奨していただきありがとうございます。 – mcauthorn