たとえば、2つのファイルa.txtとb.txtがあり、2つのファイルのデータを追加したい一緒に。たぶん私の場合は追加ではない、私はスパークの複数の引数で関数に取り組む方法をテストしたいだけで、引数のデータはローカルファイルから生成されたrddから来る。sparkでは、引数のデータはローカルファイルから生成されたrddから得られます。
私たちは、このようなコードとして、一つのファイルのデータに番号を追加することができます。
a_data = sc.textFile("a.txt")
a_data.map(lambda x: x + 5)
どのように火花RDDと一緒に、2つのファイルのデータを追加しますか?
? – Shaido
ご返信ありがとうございます。多分私の説明は明確ではない。私は問題の記述を修正します。 –