多くの機能の中でパラメータnpartitions
が表示されていますが、それが何のために良いのかわかりません。Daskデータフレーム内のnpartitionsの役割は何ですか?
http://dask.pydata.org/en/latest/dataframe-api.html#dask.dataframe.read_csv
ヘッド(...)警告が最初のnPartitions内の行をしますnより少ない場合
要素のみが1のデフォルトで、最初のnPartitionsから取られすべての見つかった行が返されます。すべてのパーティションを使用するには、-1を渡します。
配分(...)出力のパーティションの
数、入力のnPartitionsをより小さくなければなりません。部門が指定されていない場合にのみ使用されます。
おそらくこの場合は5パーティションの数です:
(画像ソース:http://dask.pydata.org/en/latest/dataframe-overview.html)