スパークCSVエスケープが動作しない

私はspark-coreバージョン2.0.1をScala 2.11で使用しています。 \ escapesを持つcsvファイルを読むための簡単なコードがあります。スパークCSVエスケープが動作しない

val myDA = spark.read 
     .option("quote",null) 
    .schema(mySchema) 
    .csv(filePath)

ドキュメントごとに\ csvリーダーのデフォルトのエスケープです。しかし、それは動作しません。スパークはデータの一部として\を読んでいます。例：csvファイルのCity列は北岩\、auです。私は都市の列がnorthrocks、auとコードで読まれることを期待しています。しかし、火花はそれをnorthrocks \と読み取り、auを次の列に移動します。私は、次の試してみましたが、うまくいきませんでした

：

明示的に定義されたエスケープ.OPTION（ "エスケープ"、 "\"）
変更脱出へ|または：私は火花CSVライブラリー

同じ問題に直面していずれかを使用してみましたが、ファイルに、コード

に？何か不足していますか？

ありがとうございました

出典

2016-10-27 JNish

これらの間の分離方法を置き換えることはできますか？北の岩：あおい。私は '' north rocks \、au''のような引用符で全体をラップしようとします – raam86

残念ながら私は入力ファイルを制御できません。 – JNish

これが原因である可能性があります。https://issues.apache.org/jira/browse/CSV-135 – JNish

だから、エスケープは引用符でのみ動作します。あなたがエスケープしたい場合は、引用符を使用することをお勧めします。

https://github.com/databricks/spark-csv/issues/390

出典

2016-10-27 21:59:38 JNish

スパークCSVエスケープが動作しない

答えて

関連する問題