私は多くの列を持つ大きなデータフレームを持っています。私が興味を持っている2つの主要なコラムはメッセージと名前です。各メッセージは個人的な状態のようなものになり、その人の名前が付随します。かなり巨大ですが、凝縮されたバージョンは、[悲しい、幸せな、安心した、怒っている、怒っている、恍惚状態、誇りに思う'、' disappointed ']。名前ごとに(そして複数のメッセージを持つことができるので名前を繰り返してもかまいません)、使用した感情語とそれに付随する数を追跡したいと思います。例えば(私は本当に大きなデータセットを持っているので、私はこれを作っています):パンダに辞書の辞書(または類似の機能を持つもの)を保存するにはどうすればいいですか?
Message Name
I am really happy with my progress. Alice
I was annoyed by his inconsideration. John
I felt proud after seeing her performance. Lisa
I am ecstatic after hearing the good news. Alice
I felt disappointed by her dishonesty Lisa
私は基本的に私に次のことを言うだろう何かを望んでいた場合は(私は必ずしも限り、それはきれいだとフォーマットを気にしません):{アリス:幸せ:1、恍惚状態:1;ジョン:悩まされる:1;リサ:誇り高い:1、失望した:1}
これを行う最も簡単な方法は何ですか?辞書の辞書はこれを行うための最善の方法ですか?第二に、これは追加の関連する質問の一種です。上記の計算の後、各名前に最も頻繁に使用される感情語を探したい場合はどうしたらいいですか?この例では、すべてが1でかなり結びついていますが、カウントが同じではないと想像してください。
1行に 'message'が2回ある場合、それを1つか2つと数えたいですか? – exp1orer
たとえば、1行のメッセージに「happy」が2回ありますか?私はそれについて本当に考えていなかったが、2倍は良い。 –