2017-02-11 11 views
1

私はtableauの下敷きデータセットからいくつかのデータをcsvとしてエクスポートしました。私はlessでそれを表示しようとすると、それは私がTableau csvをSparkにインポート

cat file.csv | cut -d ',' -f 1

を行うときに、それmay be a binary file. See it anyway?

は、しかし、それはそれは最初のフィールドを印刷しませんが(人間可読データを示しているが、と言っていますライン全体)。

だから私はとスパーク2でそれをロードしよう:

data = sqlContext.read.csv("file.csv") 
data.show(5) 

そして私が手:私はこの仮定バイナリファイルからのデータフレームを作ることができる方法を

+--------------------+ 
|     _c0| 
+--------------------+ 
|��Cluster ...| 
+--------------------+ 

任意のアイデアを?

+0

このリンクの方法を使用して、テーブルのデータをCSVにエキスパートしてください:http://www.vizwiz.com/2014/03/the-greatest-tableau-tip-ever-exporting.html読み込み可能なCSVは今ですか? – Yaron

答えて

1

最後に、UTF-16テキストファイルであったに違いありません。ので、私は、UTF-8 /アスキーと罰金ロード変換されたファイルにファイルを変換するために

iconv -f UTF-16 -t UTF-8//TRANSLIT file.csv > file-utf8.csv 

を使用しました。