1
の多くの関数言語では、map
のように機能しますが、多くの関数言語ではflatten戻り値が定義されています。 Spark/pysparkにはそれがありますhttp://spark.apache.org/docs/latest/api/python/pyspark.html#pyspark.RDD.flatMapdaskのflatMap
daskに入れるにはどうすればいいですか? dictsの
import dask.bag as db
import json
from tools import get_records
records = db.read_text(json_file).map(json.loads).map(get_records)
get_records
戻りリスト: 私のコードは次のようになります。私はちょうど1つのシーケンスにそれらをチェーンする必要があります。