2017-10-06 10 views
1

2つのDaskオブジェクトが同じ結果を参照しているかどうかを判断する正しい方法は何ですか?両方の属性nameを比較するのと同じくらい単純か、実行する必要がある他のチェックがありますか?2つのDaskが同じかどうかの確認

答えて

1

メインライブラリ(array、bag、delayed、dataframe)のdaskコレクションのいずれの場合も、等号は等しい値を意味する必要があります。

しかし、逆の場合は必ずしも真ではありません。私たちはどこでも決定論的ハッシングを使用しません。時にはuuidを使用することもあります。たとえば、ランダム配列は常にキーのランダムUUIDを取得しますが、2つのランダムな配列が偶然等しくなる可能性があります。

Daskライブラリの外部で行われたコレクションの保証はありません。スケジューラーレベルでの施行は行われません。

+0

ハッシュ衝突の良い点(ランダム配列に関する)。 – jakirkham

+0

明確にするために、私はキーが異なっていても値の等しいことを指していました。同じ数字のセットでさまざまな方法で来ることができます。ハッシングは、最終結果ではなくパスによって定義されます。 – MRocklin

関連する問題