私は値のリストを作成する関数を持っています。データフレームから行が与えられたときに、そのような関数が行う可能性のあるものを単純化したものです。適用されたメソッドの結果の辞書を返すデータフレームのDaskメソッド
def generate_key_list_pair(row):
some_list = do_something_to_make_a_list(row)
return some_list
私はその後、DASKのデータフレーム内のすべての行にその方法を適用し、辞書を返したい
ように:
ddf.apply(generate_key_list_pair)
が...そのキー行IDた辞書を返しますし、それぞれの行からの結果は、例えば、機能を適用して、その値:n
て1
はだろう
{
1: [3.0, 4.12, 5.2, 23.1, 4.9],
...
n: [9.34, 8.12, 3.42, 12.1, 34.2]
}
を各generate_key_list_pair
関数呼び出しに渡された行オブジェクトからの列の値。
編集:1 ... nは元のデータフレームの列内に存在する一意の識別子です。
クリアするには、1..nは各パーティション内の行インデックス値です(パーティションごとに繰り返されます)。 – mdurant
それを聞いてくれてありがとう。 1 ... nは、データフレームの列内に存在する一意の識別子です。元の質問を編集して明確にすることができます。 – kuanb