レコードはその後、私のScalaのコードでは、私は、各フィールドをフェッチする「の\ U0001」として使用区切り記号^ _のそれぞれのUnicodeはスカラーコードでどのように使用されますか?
val fileLoc = "/user/cloudera/inputfiles/records.txt"
val custAccountRDD = sc.textFile(fileLoc)
val splitRDD = custAccountRDD.map(elem => elem.split("\\u0001"))
することができ^ Aによって区切られている場合、私は^ _
サンプルと同等の区切り文字は何か希望は、私は直接その下にしようとした入力レコード
4^_123123123^_Any Purchase^_ACTIVE^_1^_DATA^_Published
私の質問は、私は区切り文字に基づいてこれらのレコードをどのように分割しないさ^ _
はなかったです役に立たない
val splitRDD = custAccountRDD.map(elem => elem.split("^_"))
私はあなたが何を求めているのかよく分かりません。あなたは入力 '4^_123123123^_Any Purchase^_ACTIVE^_1^_DATA^_Published'に対してどんな出力をしたいのかをもっと具体的にすることができますか? '^ _'について:これは特殊文字か、単に文字列"^_ "ですか? –
@Dat:^ _は入力ファイルの各レコードの区切り文字です。この区切り文字はUnit Separatorと呼ばれます。 –