を繰り返し単語を数えることができます:あなたが見ればは、どのように私はget_dummiesを使用して文字列カラムを使用して2つのデータフレームに参加し、私は以下の例持つややマトリックスビューを作成しようとしていますこんにちは、文字列の中
import pandas as pd
sales = [{'account': 'Jones,LLC', 'Jan': 150},
{'account': 'Alpha,Co', 'Jan': 200},
{'account': 'Blue,Inc', 'Jan': 50,}]
df = pd.DataFrame(sales)
sales2 = [{'account': 'Jones,LLC,Co,Jones'},
{'account': 'Alpha,Co,Blue'},
{'account': 'Blue,Inc',}]
df2 = pd.DataFrame(sales2)
df3=df.join(df2.account.str.get_dummies(sep=','))
df3.head()
をdf2を見ると、最初の行にJonesという文字列が2回含まれていることがわかります。df3を見ると、Jones列の最初の行が1で、df2の最初の行に2回表示されます。
私は
|---------------------|------------------|
| account | Jones |
|---------------------|------------------|
| Jones,LLC | 1 |
|---------------------|------------------
私はこれを取得したい(私だけが興味のあるDFの割合を示す)これを取得するには:
|---------------------|------------------|
| account | Jones |
|---------------------|------------------|
| Jones,LLC | 2 |
|---------------------|------------------
これは良い答えです!一を足す。私は 'apply'の後に' fillna(0).astype(int) 'を追加したいと思います。 – piRSquared
ありがとうございました! –