以下のようなsyslogがあります。pyparsingでsyslogメッセージを解析する方法
日= 2015年10月8日、時間= 16:03:26 devnameを= D1_FIG DEVICE_ID = ID300B3908601UID LOG_ID = 0021000002タイプ=トラフィックのサブタイプ=許可PRI =通知VD =ルートSRC = 157.56.15.15 src_port = 3584 src_int =」 port4 "dst = 211.16.12.55 dst_port = 80 dst_int =" WLN_200 "SN = 2775431942 status = accept policyid = 430 dst_country ="英国、英国 "src_country ="英国、英国 "dir_disp = org tran_disp = dnat tran_ip = 12.15.7.17 tran_port = 80 service = HTTPプロトコル= 6 duration = 120 sent = 132 rcvd = 92 sent_pkt = 3 rcvd_pkt = 2
このようなpyparsingを使用してこのログを解析します。
{"date", "2015-10-08"}
{"time", "16:03:26"}
{"devname", "D1_FIG"}
{"device_id", "ID300B3908601UID"}
....
{"src", "157.56.15.15"}
....
{"dst_country", "United Kingdom, Great Britain"}
....
ソースコードはこのようです。
from pyparsing import *
origin_str = "date=2015-10-08 time=16:03:26 devname=D1_FIG device_id=ID300B3908601UID log_id=0021000002 type=traffic subtype=allowed pri=notice vd=root src=157.56.15.15 src_port=3584 src_int=\"port4\" dst=211.16.12.55 dst_port=80 dst_int=\"WLN_200\" SN=2775431942 status=accept policyid=430 dst_country=\"United Kingdom, Great Britain\" src_country=\"United Kingdom, Great Britain\" dir_disp=org tran_disp=dnat tran_ip=12.15.7.17 tran_port=80 service=HTTP proto=6 duration=120 sent=132 rcvd=92 sent_pkt=3 rcvd_pkt=2"
date_s = Word(nums, nums+'-')
time_s = Word(nums, nums+':')
identifier = Word(alphas, alphanums+'_') | date_s | time_s
equal = Literal("=").suppress()
KeyNValue = identifier.setResultsName("lhs") + equal + identifier.setResultsName("rhs")
for srvrtokens,startloc,endloc in KeyNValue.scanString(origin_str):
print srvrtokens
これは私がこれまで持っているものです。
['date', '2015-10-08']
['time', '16']
['devname', 'FW_IDC1']
['device_id', 'FG300B3908601477']
['log_id', '0021000002']
['type', 'traffic']
['subtype', 'allowed']
['pri', 'notice']
['vd', 'root']
['src', '147']
['src_port', '58979']
['dst', '210']
['dst_port', '80']
['SN', '2770251942']
['status', 'accept']
['policyid', '430']
['dir_disp', 'org']
['tran_disp', 'dnat']
['tran_ip', '172']
['tran_port', '80']
['service', 'HTTP']
['proto', '6']
['duration', '120']
['sent', '132']
['rcvd', '92']
['sent_pkt', '3']
['rcvd_pkt', '2']
しかし、私は「時間」と「dst_country」文字列を解析する方法がわかりません。
があなたの所望の出力はかなり 'dict'または' list'ではありません。あなたの望む結果の形はどういうものですか? –
どちらでもかまいません。私の問題は解析中です。あなたの答えは私の問題を解決することです! – appdid