1
dask.bag
を使用してjsonファイルを読み取るとき、ファイル内のjsonが複数行の場合はJSONDecodeError
になります。`dask.bag` JSONDecodeError複数行のjson配列を読み込んだ場合
import json
import dask.bag as db
db.read_text('single-line.json').map(json.loads).compute()
[[{'a': 'b'}, {'c': 'd'}]]
db.read_text('multi-line.json').map(json.loads).compute()
JSONDecodeError: Expecting value: line 2 column 1 (char 2)
サンプルファイルは次のようになりされています
シングルライン
[{"a": "b"}, {"c": "d"}]
マルチライン
[
{"a": "b"},
{"c": "d"}
]
が、これはバグですか、私は何かがあります行方不明?また
私は複数行のファイルを読むことができることは注目に値する
with open('multi-line.json') as f:
data = f.read()
print(json.loads(data))
[{'a': 'b'}, {'c': 'd'}]