非常に大きなJSONファイルをPythonで読み込もうとしています。私は試しました:スキーマを知らずに非常に大きなJSONファイルをロードしていますか?
import json
data = open('file.json').read()
loaded = json.loads(data)
しかし、それは私にSIGKILLエラーを与えます。
私が試してみた:
import pandas as pd
df = pd.read_json('file.json')
を、私はメモリ不足のエラーが発生します。
ijson
を使用してデータをストリーミングし、サブセットを一度に取り出すことを試みたいと思います。ただし、JSONファイルのスキーマがどのようなイベントであるかを知る必要があります。実際にJSONファイルのスキーマがわからない。だから、私は2つの質問がある:
は、スキーマを知らなくてもPythonで大きなJSONファイルを読み込むか、ストリームする方法はありますか? JSONファイルを別の形式に変換する方法(または、たとえばpostgresqlサーバーに変換する方法)
私のJSONファイルのスキーマを吐くためのツールがありますか?
UPDATE:
は私のJSONファイルがどのように見えるかのアイデアを得るためにhead file.json
を使用します。そこから少し楽です。
jsonファイルのサンプルを投稿できますか? –