が、私はこのような文字列があるとします。Python、かっこ内にあるものを無視して、key = valueリストを解析するにはどうすればよいですか?
"key1=value1;key2=value2;key3=(key3.1=value3.1;key3.2=value3.2)"
私はkey3
の値は、文字列
"(key3.1=value3.1;key3.2=value3.2)"
、最終的には、対応するサブある上記に対応する辞書を取得したいと思います辞書。
私はセミコロンで文字列を分割する方法を知っていますが、括弧の間にセミコロンを無視するようにパーサーに指示する方法はありますか?
これには、潜在的にネストされたカッコが含まれます。
現在、私はマッチング括弧のペアを探しアドホックルーチンを使用しています、「クリア」、その内容、位置を分割し、元の文字列に適用しますが、これは非常にエレガント表示されない、いくつか存在しなければなりませんこれを行うためにあらかじめパッケージ化されたpythonic方法。
誰もが興味を持っている場合は、ここで私は現在、使用していますコードです:
def pparams(parameters, sep=';', defs='=', brc='()'):
'''
unpackages parameter string to struct
for example, pippo(a=21;b=35;c=pluto(h=zzz;y=mmm);d=2d3f) becomes:
a: '21'
b: '35'
c.fn: 'pluto'
c.h='zzz'
d: '2d3f'
fn_: 'pippo'
'''
ob=strfind(parameters,brc[0])
dp=strfind(parameters,defs)
out={}
if len(ob)>0:
if ob[0]<dp[0]:
#opening function
out['fn_']=parameters[:ob[0]]
parameters=parameters[(ob[0]+1):-1]
if len(dp)>0:
temp=smart_tokenize(parameters,sep,brc);
for v in temp:
defp=strfind(v,defs)
pname=v[:defp[0]]
pval=v[1+defp[0]:]
if len(strfind(pval,brc[0]))>0:
out[pname]=pparams(pval,sep,defs,brc);
else:
out[pname]=pval
else:
out['fn_']=parameters
return out
def smart_tokenize(instr, sep=';', brc='()'):
'''
tokenize string ignoring separators contained within brc
'''
tstr=instr;
ob=strfind(instr,brc[0])
while len(ob)>0:
cb=findclsbrc(tstr,ob[0])
tstr=tstr[:ob[0]]+'?'*(cb-ob[0]+1)+tstr[cb+1:]
ob=strfind(tstr,brc[1])
sepp=[-1]+strfind(tstr,sep)+[len(instr)+1]
out=[]
for i in range(1,len(sepp)):
out.append(instr[(sepp[i-1]+1):(sepp[i])])
return out
def findclsbrc(instr, brc_pos, brc='()'):
'''
given a string containing an opening bracket, finds the
corresponding closing bracket
'''
tstr=instr[brc_pos:]
o=strfind(tstr,brc[0])
c=strfind(tstr,brc[1])
p=o+c
p.sort()
s1=[1 if v in o else 0 for v in p]
s2=[-1 if v in c else 0 for v in p]
s=[s1v+s2v for s1v,s2v in zip(s1,s2)]
s=[sum(s[:i+1]) for i in range(len(s))] #cumsum
return p[s.index(0)]+brc_pos
def strfind(instr, substr):
'''
returns starting position of each occurrence of substr within instr
'''
i=0
out=[]
while i<=len(instr):
try:
p=instr[i:].index(substr)
out.append(i+p)
i+=p+1
except:
i=len(instr)+1
return out
あなたはJSONを使用することができます標準の永続化形式 –
を使用する方がはるかに簡単だろうか? – jterrace