2017-12-14 15 views
0

awsとjsonファイルの初心者です。 ValueErrorメッセージを受け取りました:awsで使用するとpd.read_jsonエラーが発生する

ValueError:配列値(2)をデコードする際に予期しない文字が見つかりました。 )

jsonファイルはkaggle competetionからダウンロードされました:https://www.kaggle.com/c/statoil-iceberg-classifier-challenge/data。この "-27.878360999999998"のような数字の画像データが2つあります

ローカルコンピュータで実行するとエラーメッセージは表示されませんでした。 awsインスタンス(Deep Learning AMI -Amazon Linux - 2-0)では絶対パスを使用しようとしましたが、動作しませんでした。一つのことは、私は他のjsonファイルがそのインスタンスで同じコード行を使用するのを読むことができるということです。このjsonファイルを長い番号で読み取ることはできません。

これはデータがどのように見えるかで、ローカルコンピュータでデータフレームを取得します。

'train.json' to dataframe

のpython、サーバ内のパンダは私のローカルコンピュータと同じか新しいバージョンです。

ありがとうございます。

答えて

0

私は同じ問題に直面していたし、私が見つけた回避策があった。

  1. json.7zファイルを抽出するために、任意の解凍ツールを使用します。
  2. ここに抽出されるファイルは 'processed/data/train.json'です。 このファイルは、AWS AMIでpandasを使用して開いたときに機能しました。

これが役に立ちます。

+0

私のために働いた!また、jsonファイルの代わりにzipファイルをアップロードする方がはるかに高速です。本当にありがとうございます。 –

関連する問題