大きな.xmlファイルがいくつかあります。私はいくつかのことをするためにファイルを解析したい。PythonでXMLを解析する
私だけ引き出すたい:
- XML-/TITLE1をし、(例えば)
- XML-/TITLE2の一覧を表示し、/ B
- XML-を一覧表示するには、それを保存するためにそれを保存ライブラリは/使用をインポートするのがベストだろうPythonの2.xのを使用してC
- など、など
を一覧表示することをTITLE3して保存します。どのように私はこれを設定するのですか? 提案がありますか?例については
:
<PubmedArticle>
<MedlineCitation Owner="NLM" Status="MEDLINE">
<PMID Version="1">8981971</PMID>
<Article PubModel="Print">
<Journal>
<ISSN IssnType="Print">0002-9297</ISSN>
<JournalIssue CitedMedium="Print">
<Volume>60</Volume>
<Issue>1</Issue>
<PubDate>
<Year>1997</Year>
<Month>Jan</Month>
</PubDate>
</JournalIssue>
<Title>American journal of human genetics</Title>
<ISOAbbreviation>Am. J. Hum. Genet.</ISOAbbreviation>
</Journal>
<ArticleTitle>mtDNA and Y chromosome-specific polymorphisms in modern Ojibwa: implications about the origin of their gene pool.</ArticleTitle>
<Pagination>
<MedlinePgn>241-4</MedlinePgn>
</Pagination>
<AuthorList CompleteYN="Y">
<Author ValidYN="Y">
<LastName>Scozzari</LastName>
<ForeName>R</ForeName>
<Initials>R</Initials>
</Author>
</AuthorList>
<MeshHeadingList>
<MeshHeading>
<DescriptorName MajorTopicYN="N">Alleles</DescriptorName>
</MeshHeading>
<MeshHeading>
<DescriptorName MajorTopicYN="Y">Y Chromosome</DescriptorName>
</MeshHeading>
</MeshHeadingList>
<OtherID Source="NLM">PMC1712541</OtherID>
</MedlineCitation>
</PubmedArticle>
私はこのため 'xml.dom.minidom'を使用すると思い、それは、Pythonに付属しており、正常に動作します。 'lxml'は良いライブラリですが、インストールする必要があります。 – kindall