1
sparkシェルでは、入力ファイルを読み込み、次にsaveAsTextFile()メソッドを使用して最終的なrddを保存するフィールド値をトリミングします。入力ファイルのフィールド区切り文字は '|'です。出力ファイルでは、フィールド区切り文字を '、'として取得しています。Sparkのデフォルト出力デリミタの変更方法
Input Format: abc | def | xyz
Default Output Format: abc,def,xyz
ABCのように必要な出力形式の何か| DEF |「|」、そう提案してください比べた場合、XYZ
は、デフォルトの出力区切り値を変更することがとにかくあります。 RDDのために
[sparkの出力から括弧を削除する]の複製(http://stackoverflow.com/questions/29945330/remove-parentheses-from-output-in-spark) –