2
用語文献マトリックスにrownames、れる列および周波数を含むDF: 入力:変換パンダは、私は次の形式でパンダのDFを有する
Freq Document TermId
3 A 112
5 A 055
1 C 003
4 D 001
2 B 003
1 D 089
I用語ドキュメントマトリックスにこのデータフレームを変換する(好ましくは、別のパンダス)。これを達成する最も効率的な方法は何でしょうか?
例出力:所望のデータフレームは、ラベルdf['TermId']
、その列のラベルdf['Document']
からのものであるからである指数を有すること
Term/Document A B C D
001 0 0 0 4
003 0 2 1 0
055 5 0 0 0
089 0 0 0 1
112 3 0 0 0
感謝!元のdfのTermId列に重複があったため、df.pivot_tableが私のために働いていました –