pyparsingを使用すると、再帰的な降下中のコンテキストを抽出することができます。私が何を意味するのか説明しましょう。テキスト構造情報を保持する - pyparsing
import pyparsing as pp
openBrace = pp.Suppress(pp.Literal("{"))
closeBrace = pp.Suppress(pp.Literal("}"))
ident = pp.Word(pp.alphanums + "_" + ".")
comment = pp.Literal("//") + pp.restOfLine
messageName = ident
messageKw = pp.Suppress(pp.Keyword("msg"))
text = pp.Word(pp.alphanums + "_" + "." + "-" + "+")
otherText = ~messageKw + pp.Suppress(text)
messageExpr = pp.Forward()
messageExpr << (messageKw + messageName + openBrace +
pp.ZeroOrMore(otherText) + pp.ZeroOrMore(messageExpr) +
pp.ZeroOrMore(otherText) + closeBrace).ignore(comment)
testStr = "msg msgName1 { some text msg msgName2 { some text } some text }"
print messageExpr.parseString(testStr)
この出力生成します:私は、次のコードを持っている出力では['msgName1', 'msgName2']
を、私が埋め込まれた試合の構造を追跡したいと思います。私が意味することは、たとえば、上記のテスト文字列を使用して次の出力をしたいとします:['msgName1', 'msgName1.msgName2']
は、テキスト内の階層を追跡します。しかし、私はpyparsingには新しく、まだ "msgName2
"が "msgName1
"の構造に埋め込まれているという事実を抽出する方法を見つけていません。
ParserElement
のsetParseAction()
メソッドを使用する方法がありますか、または結果の命名を使用していますか?
参考になりますようお願い申し上げます。
外部スタックに名前をプッシュする 'messageName'に解析アクションを添付しますその最後の名前をスタックからポップするために、parseアクションをcloseBraceに付加します。最初の解析アクションでは、現在の名前をスタックにプッシュした後、入力トークンの名前を 'tokens [0] = '。'と置き換えることができます。 – PaulMcG