1
特に、私はR::data.table
d[, function(...), by = key]
のようなものが欲しいです。別のStackOverflowの質問( Julia Dataframe group by and pivot tables functions)のための答えを使用して、私は、このソリューションを持っている:ジュリアでのファストグループの運営方法
using DataFrames
df =DataFrame(Location = [ "NY", "SF", "NY", "NY", "SF", "SF", "TX", "TX", "TX", "DC"],
Class = ["H","L","H","L","L","H", "H","L","L","M"],
Address = ["12 Silver","10 Fak","12 Silver","1 North","10 Fak","2 Fake", "1 Red","1 Dog","2 Fake","1 White"],
Score = ["4","5","3","2","1","5","4","3","2","1"])
julia> by(df, :Location, d -> DataFrame(count=nrow(d)))
4x2 DataFrames.DataFrame
| Row | Location | count |
|-----|----------|-------|
| 1 | "DC" | 1 |
| 2 | "NY" | 3 |
| 3 | "SF" | 3 |
| 4 | "TX" | 3 |
正常に動作しますが、それは大規模なデータセットのために非常に遅いことが判明したこと。速い解決策はありますか?
チェックも、この(やや厄介)スレッド及び関連するブログ記事のhttps:(逐次的に計算することができます)他の集約関数のために我々は関数を定義することができます/ /discourse.julialang.org/t/various-by-group-strategies-compared/6594 –