ローカルにサンプルデータセットがあり、クラスタ上でいくつかの基本操作を実行しようとしています。エラー - ワーカーからのエラーそのようなファイルまたはディレクトリがありません: 'filepath'
import dask.dataframe as ddf
from dask.distributed import Client
client = Client('Ip address of the scheduler')
import dask.dataframe as ddf
csvdata = ddf.read_csv('Path to the CSV file')
クライアントは、順番に(他のマシン上で)2人の労働者に接続されているスケジューラに接続されています。
私の質問はかなり簡単かもしれません。
このcsvファイルは他のワーカーノードに存在する必要がありますか?
ファイルが見つかりませんでした。また、
futures=client.scatter(csvdata) x = ddf.from_delayed([future], meta=df) #Price is a column in the data df.Price.sum().compute(get=client.get) #returns" dd.Scalar<series-..., dtype=float64>" How do I access it? client.submit(sum, x.Price) #returns "distributed.utils - ERROR - 6dc5a9f58c30954f77913aa43c792cc8"
を使用して
は、私はここに多くのものを混合だし、私の理解がアップ混乱さを考えて、この Loading local file from client onto dask distributed clusterとhttp://distributed.readthedocs.io/en/latest/manage-computation.html
を参照してくださいました。 本当にありがとうございます。