2017-05-07 8 views
1

私はパンダの代わりにdaskを使用できるかどうかを知りたいと思います。私が直面しうる問題は何ですか?パンダのインプレース交換を怠っていませんか?

1)daskは、小さなデータセットの場合、パンダよりも遅くなると思います。私は、データのサイズが分からず、サーバーの構成もわからないときがあるので、これで問題はありません。

2)私は

私はDASKのデータフレームは、データフレームの缶をパンダ何かを行うことができない状況に直面するだろう()例えばコンピューティングのためのわずかに異なる構文を習得する必要がありますか?

答えて

3

これは非常に広い質問です。一般的に私はdask.dataframe documentationを参照することをお勧めします。

Dask.dataframeはすべてのパンダを実装していません。 (近似解がしばしば存在してもおおよその分位のように、)、中央値のように、並列に正確に行うのは難しいです

  • 操作
  • 反復処理の行を超える

    1. 突然変異さ操作:これは、以下の動作の種類を含みデータフレーム
    2. APIの小さなコーナーで、誰もコピーする気にならない。

    しかし、daskデータフレームは多くの小さなデータフレームのコレクションなので、単純なケースではこれらの制限のいくつかを回避することができます。

  • 関連する問題