0
私はチャットデータセットを持っており、会話グループを作り、いくつのメッセージを送信したかをカウントしたいと思います。python group chat id
ここは私のデータです。このデータは、 "ID"のチャットログで、名前はJimmyです。
Sender Receiver Text
ID person1 HI
person1 ID Hello~
ID person1 My name is Jimmy
person1 ID Nice to meet you!
ID person1 Nice to meet you, too
ID person2 Hi
person1 ID Hi there
ID person2 My name is Jimmy
person1 ID My name is Abi
ID person2 Nice to meet you
... .... .....
"ID"は複数の男とチャットできます。
各会話のメッセージ数を数えたいと思います。
この場合、両方の会話には5つのメッセージがあります。
私はコードを書いていますが、データが大きいので非効率的です。
#chat_df is the dataframe of chat data
df = []
total_message =[]
receiver_id = chat_df["receiver"].unique()
for x in rid:
total_message.append(len(chat_df[(chat_df["receiver"] == x) | (chat_df["sender"] == x)]))
df.append(chat_df[(chat_df["receiver"] == x) | (chat_df["sender"] == x)])
2人のチャットデータのペアを取得する効率的な方法はありますか?
ありがとうございました!それだけが必要! もう1つの質問です。 もし私がそれらのより高いカウント(5以上)について各メッセージのテキストの数を数えたいのであれば、それを達成するためにどのように提案しますか? お世話になりました! – jimmy15923
ありがとうございます。私はあなたの2番目の質問について考えています。私はループとして、[ブールインデックス作成](http://pandas.pydata.org/pandas-docs/stable/indexing.html#boolean-インデックス作成)。 – jezrael
平均数は何文字ですか?単語を数えますか?またはテキストメッセージの長さ? – jezrael