2016-12-16 19 views
0

Spark HQLで以下のJSONファイルをロードしようとしましたが、正常にロードできませんでした。 _corrupt_recordエラーを返します。複雑なJSON Spark HQLをロードできません - _corrupt_recordエラー

誰もがこのエラーを軽視することはできますか?私はNotepad ++(JSToolプラグイン)のような他のアプリケーションでファイルを読み込んで使用することができ、それが適切で壊れていないと確信しています。

{"markers": [ 
 
\t \t { 
 
\t \t \t "point":new GLatLng(40.266044,-74.718479), 
 
\t \t \t "homeTeam":"Lawrence Library", 
 
\t \t \t "awayTeam":"LUGip", 
 
\t \t \t "markerImage":"images/red.png", 
 
\t \t \t "information": "Linux users group meets second Wednesday of each month.", 
 
\t \t \t "fixture":"Wednesday 7pm", 
 
\t \t \t "capacity":"", 
 
\t \t \t "previousScore":"" 
 
\t \t }, 
 
\t \t { 
 
\t \t \t "point":new GLatLng(40.211600,-74.695702), 
 
\t \t \t "homeTeam":"Hamilton Library", 
 
\t \t \t "awayTeam":"LUGip HW SIG", 
 
\t \t \t "markerImage":"images/white.png", 
 
\t \t \t "information": "Linux users can meet the first Tuesday of the month to work out harward and configuration issues.", 
 
\t \t \t "fixture":"Tuesday 7pm", 
 
\t \t \t "capacity":"", 
 
\t \t \t "tv":"" 
 
\t \t }, 
 
\t \t { 
 
\t \t \t "point":new GLatLng(40.294535,-74.682012), 
 
\t \t \t "homeTeam":"Applebees", 
 
\t \t \t "awayTeam":"After LUPip Mtg Spot", 
 
\t \t \t "markerImage":"images/newcastle.png", 
 
\t \t \t "information": "Some of us go there after the main LUGip meeting, drink brews, and talk.", 
 
\t \t \t "fixture":"Wednesday whenever", 
 
\t \t \t "capacity":"2 to 4 pints", 
 
\t \t \t "tv":"" 
 
\t \t }, 
 
] }

+0

あなたの試みたコードを共有してください – mtoto

答えて

0

あなたのJSONのみ、この構造は、デフォルトread.jsonでサポートされてい

{ object1 } 
{ object2 } 

つのオブジェクトごとに1行にする必要があります。あなたは複数行のJSONsを読みたい場合は、それはsparkContext.wholeTextFilesを介して可能になるとドキュメントで

を解析マニュアルがtextです:JSONファイルとして提供されるファイルは、典型的な ではないことを

注意JSONファイル。各行には、独立した有効な JSONオブジェクトが含まれている必要があります。その結果、通常複数行のJSONファイル が失敗することがよくあります。

関連する問題