1
私はtableauの下敷きデータセットからいくつかのデータをcsvとしてエクスポートしました。私はless
でそれを表示しようとすると、それは私がTableau csvをSparkにインポート
cat file.csv | cut -d ',' -f 1
を行うときに、それmay be a binary file. See it anyway?
は、しかし、それはそれは最初のフィールドを印刷しませんが(人間可読データを示しているが、と言っていますライン全体)。
だから私はとスパーク2でそれをロードしよう:
data = sqlContext.read.csv("file.csv")
data.show(5)
そして私が手:私はこの仮定バイナリファイルからのデータフレームを作ることができる方法を
+--------------------+
| _c0|
+--------------------+
|��Cluster ...|
+--------------------+
任意のアイデアを?
このリンクの方法を使用して、テーブルのデータをCSVにエキスパートしてください:http://www.vizwiz.com/2014/03/the-greatest-tableau-tip-ever-exporting.html読み込み可能なCSVは今ですか? – Yaron