2017-01-03 9 views
2

私はこのようなピップ使用Daskをインストール:デフォルトのピップのインストールが「はImportErrorを:いいえモジュールは、バーチャルツールという名前のない」与え

pip install dask 

を、私はimport dask.dataframe as ddをしようとするとき、私は次のようなエラーメッセージが出ます:

>>> import dask.dataframe as dd 
Traceback (most recent call last): 
    File "<stdin>", line 1, in <module> 
    File "/path/to/venv/lib/python2.7/site-packages/dask/__init__.py", line 5, in <module> 
    from .async import get_sync as get 
    File "/path/to/venv/lib/python2.7/site-packages/dask/async.py", line 120, in <module> 
    from toolz import identity 
ImportError: No module named toolz 
No module named toolz 
を私は the documentation状態

pip install dask : Install only dask, which depends only on the standard library. This is appropriate if you only want the task schedulers.

はので、私は」気づい

なぜこれがうまくいかないのか混乱している。

答えて

7

Dask 0.13.0以下では、toolz 'identityの機能がdask/async.pyの範囲内にありました。 オープン この依存関係を削除するためにGitHub issue #1849に関連するクローズプル要求があります。 その間に 何らかの理由で古いバージョンのdaskが残っている場合は、単にpip install toolzを実行して問題を回避できます。

しかし、これはとにかくimport dask.dataframe as ddで問題を解決しませんでした。

>>> import dask.dataframe as dd 
Traceback (most recent call last): 
    File "<stdin>", line 1, in <module> 
    File "/data/staff_agbio/PhyloWeb/data/dask-test/venv/local/lib/python2.7/site-packages/dask/dataframe/__init__.py", line 3, in <module> 
    from .core import (DataFrame, Series, Index, _Frame, map_partitions, 
    File "/data/staff_agbio/PhyloWeb/data/dask-test/venv/local/lib/python2.7/site-packages/dask/dataframe/core.py", line 12, in <module> 
    import pandas as pd 
ImportError: No module named pandas 

か、すでにインストールパンダを持っていた場合、あなたはImportError: No module named cloudpickleを取得したい:あなたはまだこのエラーを取得したいので。そう。

(パンダの上に構築された)DASKの並列化されたデータフレームを使用するためには、あなたがDask installation documentationで述べたように、いくつかの「エクストラ」(reference)をインストールするには、ピップを伝える必要があります:

pip install dask[dataframe] 

それとも可能性ちょうどpip install dask[complete]をして、トリックの全体のバッグを取得してください。

これを正当化する理由もDASKのドキュメントに記載されている:

We do this so that users of the lightweight core dask scheduler aren’t required to download the more exotic dependencies of the collections (numpy, pandas, etc.)

関連する問題