私はPandaのデータフレームに数百万のイベントログを保存しています。 data
という1つの列に、イベントログの詳細が格納されます。Pandas extractall()の使用方法は?
SubjectUserName=XXXX, SubjectDomainName=XX, TargetUserName=XXXX, TargetDomainName=XX.LOCAL, TargetServerName=XXXX.xx.local, TargetInfo=exchangeMDB/XXXX.xx.local, ProcessName=C:\Windows\System32\rundll32.exe
私がキャプチャされたイベントに応じて、異なるkey=value
ペアを持っている数百万行を持っています。ここでは一例です。
私が行ったのは、すべてのキーを抽出し、各キーがデータセット全体で何回見られたかを数えることです。たとえば:AssertionError: 1 columns passed, passed data had 25 columns
:私は次のエラーを取得しています
events = eventlogs()
items = events['data'].str.findall('([^ =]+)=')
items = items.value_counts()
return items
:
item, count
SubjectUserName, 1000
TargetServerName, 2000
...
私のコードは次のようになります。
この場合、extractall()や別のメソッドを使用する適切な方法は何ですか?
ありがとうございました!
- アレクサンダー。