2016-08-08 7 views
0

TLDR:LMDBバイナリファイルを調べるにはどうすればよいですか?jupiterノートブックの下でパンダのLMDBを閲覧する最短方法

完全なpy n00bはここにあります。私はちょうど私のラップにLMDBファイルをダンプして、下流のソフトウェアにバグを引き起こしているデータエラーを分析しました。私はデータスキーマを知らず、サイズは約1Gbです。私は約1時間をQを探していました。& jupyterとpandasを使ってスキーマを知らなくてもファイルをブラウズすることはできますが、喜びはありません。

これを行う最短の方法は何ですか?リンクはうまくいくはずです。

+1

一般的なプログラミングの経験はありますか?また、LMDBファイルはテキストファイルなのかバイナリなものなのでしょうか?テキストで、スニペットを入力すると、おそらく誰かが「このファイルをパンダに読み込む方法」という質問に答えることができます。 –

+0

私はプログラミングの経験がありません。Pythonではありません。 LMDBはバイナリです。 @ gordonbean – empty

+0

LMDBがバイナリで、スキーマがわからない場合、あなたはピクルに入っています。あなたはファイルをロードするためにバイトをどのように解釈するかについて知る必要があります - パンダはそれを理解できません。しかし、スキーマについて何か知っていれば、問題を解決するのに十分な情報をまとめることができます。このファイルの内容に関する情報はありますか?それはテーブルですか?どんな分野を知っていますか?存在する必要があるデータを知っていますか(つまり、最初のエントリには名前フィールドに「foobar」が必要です)? –

答えて

0

lmdbは、埋め込まれたキー値ストアのタイプです:

特定のキーを使用するか、または反復処理を行います。 値自体もバイナリシリアライズされたオブジェクトであることに注意してください - フォームがどのように形成されているかを調べる必要があります

関連する問題