my_file_*.csv
というCSVのセットからDaskデータフレームに読み込むコードを記述しようとしています。CSVの長さとしてパーティションを設定するCSVを読み取るDask
次に、CSVの長さに基づいてパーティションを設定します。私は各パーティションに関数をマップしようとしており、そのためには各パーティションがCSV全体でなければなりません。
インデックスをリセットして、各CSVの長さに基づいてパーティションを設定しようとしましたが、Daskデータフレームのインデックスが一意ではないようです。
各CSVの長さに基づいてパーティションを分割するより良い方法はありますか?
いくつかの部分に関するデータ