2016-10-27 13 views
0

私はspark-coreバージョン2.0.1をScala 2.11で使用しています。 \ escapesを持つcsvファイルを読むための簡単なコードがあります。スパークCSVエスケープが動作しない

val myDA = spark.read 
     .option("quote",null) 
    .schema(mySchema) 
    .csv(filePath) 

ドキュメントごとに\ csvリーダーのデフォルトのエスケープです。しかし、それは動作しません。スパークはデータの一部として\を読んでいます。例:csvファイルのCity列は北岩\、auです。私は都市の列がnorthrocks、auとコードで読まれることを期待しています。しかし、火花はそれをnorthrocks \と読み取り、auを次の列に移動します。私は、次の試してみましたが、うまくいきませんでした

  • 明示的に定義されたエスケープ.OPTION( "エスケープ"、 "\")
  • 変更脱出へ|または:私は火花CSVライブラリー

同じ問題に直面していずれかを使用してみましたが、ファイルに、コード

  • に?何か不足していますか?

    ありがとうございました

  • +0

    これらの間の分離方法を置き換えることはできますか?北の岩:あおい。私は '' north rocks \、au''のような引用符で全体をラップしようとします – raam86

    +0

    残念ながら私は入力ファイルを制御できません。 – JNish

    +0

    これが原因である可能性があります。https://issues.apache.org/jira/browse/CSV-135 – JNish

    答えて

    関連する問題