0
私はspark-coreバージョン2.0.1をScala 2.11で使用しています。 \ escapesを持つcsvファイルを読むための簡単なコードがあります。スパークCSVエスケープが動作しない
val myDA = spark.read
.option("quote",null)
.schema(mySchema)
.csv(filePath)
ドキュメントごとに\ csvリーダーのデフォルトのエスケープです。しかし、それは動作しません。スパークはデータの一部として\を読んでいます。例:csvファイルのCity列は北岩\、auです。私は都市の列がnorthrocks、auとコードで読まれることを期待しています。しかし、火花はそれをnorthrocks \と読み取り、auを次の列に移動します。私は、次の試してみましたが、うまくいきませんでした
:
- 明示的に定義されたエスケープ.OPTION( "エスケープ"、 "\")
- 変更脱出へ|または:私は火花CSVライブラリー
同じ問題に直面していずれかを使用してみましたが、ファイルに、コード
ありがとうございました
これらの間の分離方法を置き換えることはできますか?北の岩:あおい。私は '' north rocks \、au''のような引用符で全体をラップしようとします – raam86
残念ながら私は入力ファイルを制御できません。 – JNish
これが原因である可能性があります。https://issues.apache.org/jira/browse/CSV-135 – JNish