今、私はJavaのSAXパーサーを使用して、.docxファイルのアーカイブ内にある "document.xml"ファイルを解析しています。以下は、私が解析しようとしているもののサンプルです...今JavaのXMLファイルからテキスト値を解析する
<w:pStyle w:val="Heading2" />
</w:pPr>
<w:bookmarkStart w:id="0" w:name="_Toc258435889" />
<w:bookmarkStart w:id="1" w:name="_Toc259085121" />
<w:bookmarkStart w:id="2" w:name="_Toc259261685" />
- <w:r w:rsidRPr="00415FD6">
<w:t>Text To Extract</w:t>
</w:r>
<w:bookmarkEnd w:id="0" />
<w:bookmarkEnd w:id="1" />
<w:bookmarkEnd w:id="2" />
サンプルXML文書は、私は、属性値を取り出す方法を知っている、それは難しいことではありません。しかし、ノード内の実際のテキストを取得して解析する方法はわかりません。誰にもこれに関するアイデアや経験がありますか?前もって感謝します。
うわー、それは本当に役に立ちました。私は今、文字メソッドを使いこなしているし、ノード内にテキストを取得しています。今私はそれを構造化して、それを私が具体的に望むものに制限する方法を理解する必要があります。おかげでたくさん! –