パンダには、jsonを平坦化できるpandas.io.json.json_normalize
メソッドがあります。パンダ、json-per-line
私は、json-per-lineデータ(長時間実行されるプロセスによってファイルにストリームされる)を含むソースファイルを持っています。私は実際にそのファイルに書かれているものを変更する立場にはありません。ここではJSONの不自然な例です:
{"type": "bar", "aspect": {"Positive": 1, "Negative": 0.6}} {"type": "bar", "aspect": {"Positive": 0.6, "Negative": 1.5}}
私はlines=True
パラメータを渡すことで、通常のpandas.read_json
方法を使用してそれを読むことができます。しかし、json_normalizeのように、実際に有用な形式になるように、私はそれを平坦化したいと思います。
>>> json_normalize(json.loads('{"type": "bar", "aspect": {"Positive": 1, "Negative": 0.6}}')) aspect.Negative aspect.Positive type 0 0.6 1 bar
ソースを介してIループは、正規化し、追加した場合、それは私が追加行ごとに完全なコピーをもたらすようになるだろう。それは本当にパフォーマンスを傷つけるでしょう。
タイムテーブル情報を含めていただきありがとうございます。 – Twirrim
喜んで助けることができます!私も興味があったが、どのソリューションが最速か) – jezrael