でusa.govデータを読み取ることができ、アーカイブデータUSA GOV Sample DataないPythonやR
を通過してください今、私はRでこのファイルを読むことをお勧めしますが、その後に述べたエラーの下
result = fromJSON(textFileName)
Error in fromJSON(textFileName) : unexpected character 'u'
を取得しますその後、前述のエラーの下になってPythonでそれを読むために
import json
records = [json.loads(line) for line in open(path)]
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
codecs.charmap_decode(input,self.errors,decoding_table)[0]
24
25 class StreamWriter(Codec,codecs.StreamWriter):
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 4088: character maps to <undefined>
私はこの種のファイルをどのように読むことができますか教えてください。
DunnoはRですが、あなたのPythonサンプルは私のために働いています(Python 2.7/Linux)。おそらく、 "for"ループ内のeahラインを解析して、このエンコーディングの問題をどのラインがトリガーするのかを調べるべきでしょう。 – glenfant
utf8エンコーディングでファイルを開く必要があります –