1
ネストされたループを使用せずにこれを行うには、離れていなければなりません。Dataframe列の内容を新しい列に展開する
私は最終的に、私はそれぞれのCOLがあるように、カラム内のリストの中の値から「拡大」したいDF(文字列のリストを持つ列があります注意してください)
df = DataFrame({'A' : [5,6,3,4], 'B' : [1,2,3,5], 'C' : [['a','b'],['b','c'] ,['g','h'],['x','y']]})
を持っています可能なリストアイテムであり、各行に対して、その値が表示される場合は、正しい列に1があります。例えば
あなたがpandas.get_dummies
を使用したが、その後
columns
と集計
max
によって
groupby
を必要とすることができます
df =
A B C a b c g h x y
5 1 ['a','b'] 1 1
6 2 ['b','c'] 1 1
3 3 ['g','h'] 1 1
4 5 ['x','y'] 1 1
素晴らしいです!できます。とにかくそれを「インプレース」にするためにそこにはあります。私が操作しようとしているデータフレームは〜20GBです。 –
'get_dummies'は複雑な関数なので、残念ながら私はあなたを助けません。 「20GB」は本当に大きなdfです:( – jezrael
ありがとうございます。あまりにも大きいです。私はそれを分解し、それを食べるかもしれませんまたはそれを現在の構造でデータを使用する際にもっときれいになるでしょう。 –