14
私は、RのためのHadleyのplyrパッケージが非常に役に立ち、データを変換するための素晴らしいDSLを見つけました。解決している問題は非常に一般的なので、Rのデータを操作していないときには他のプログラミング言語でデータを操作することになります。HadleyのPython用のddplyの実装はありますか?
誰かがPythonに似たようなことをするモジュールが存在するかどうか知っていますか?次のようなものがあります。
def ddply(rows, *cols, op=lambda group_rows: group_rows):
"""group rows by cols, then apply the function op to each group
and return the results aggregating all groups
rows is a dict or list of values read by csv.reader or csv.DictReader"""
pass
実装するのは難しいはずはありませんが、すでに存在していれば素晴らしいでしょう。私はそれを実装するだろう、私はcols
でグループ化するためにitertools.groupby
を使用し、その後、op
関数を適用し、itertools.chainを使用してすべてをチェーンする。より良い解決策はありますか?
'operator'モジュールは、あなたのpremade関数のために便利です。 – Daenyth
これをパンダのpythonモジュールの上に書くことができれば、あなたはインターネットに勝つかもしれません(少なくとも私の目では) –
@MikeDewar:これのパンダの実装はありますか? – user248237dfsf