0
スパークのAccumulator
を使用すると、ある種の「ユニークID」を生成する方法でエグゼキュータ間で読み取ることができる一意のIDを生成できますか?ドキュメントからは、ドライバからのみアクセスできることがわかります。場合は、代替パスがありますか?スパーク:エグゼキュータの一意のID
スパークのAccumulator
を使用すると、ある種の「ユニークID」を生成する方法でエグゼキュータ間で読み取ることができる一意のIDを生成できますか?ドキュメントからは、ドライバからのみアクセスできることがわかります。場合は、代替パスがありますか?スパーク:エグゼキュータの一意のID
は、それは
ことはできませんユニークなID
を生成するために、スパークにアキュムレータを使用して、それが可能な任意の代替パスはありますか?
RDD
ため
zipWithIndex
かzipWithUniqueId
。withColumn("id", monotonically_increasing_id())
Dataset[Row]
/DataFrame
です。
zipWithUniqueIDで取得したIDを「解凍」するにはどうすればよいですか?私は参加していますが、プログラムが不安定になっています。 – Roelant