-1
Excelのソフトウェアで生成されたXMLファイルがあります。ファイルは次のようにして作成されます:Excelで生成されたxmlファイルをPythonでインポートする
<?xml version="1.0"?>
<?mso-application progid="Excel.Sheet"?>
<Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet"
xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:x="urn:schemas-microsoft-com:office:excel"
xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet"
xmlns:html="http://www.w3.org/TR/REC-html40">
...
<Worksheet ss:Name="Table1">
<Table ss:ExpandedColumnCount="9" ss:ExpandedRowCount="162" x:FullColumns="1"
x:FullRows="1" ss:DefaultRowHeight="15">
<Column ss:AutoFitWidth="0" ss:Width="110.25" ss:Span="8"/>
<Row ss:AutoFitHeight="0">
<Cell><Data ss:Type="String">Sezione</Data></Cell>
<Cell><Data ss:Type="String">Bambino</Data></Cell>
<Cell><Data ss:Type="String">Sesso</Data></Cell>
<Cell><Data ss:Type="String">Luogo di nascita</Data></Cell>
<Cell><Data ss:Type="String">Data di nascita</Data></Cell>
<Cell><Data ss:Type="String">Indirizzo</Data></Cell>
<Cell><Data ss:Type="String">CAP</Data></Cell>
<Cell><Data ss:Type="String">Città</Data></Cell>
<Cell><Data ss:Type="String">Accompagnatori</Data></Cell>
</Row>
<Row ss:AutoFitHeight="0">
<Cell><Data ss:Type="String">ARANCIONE</Data></Cell>
<Cell><Data ss:Type="String">pippo </Data></Cell>
<Cell><Data ss:Type="String">Maschile</Data></Cell>
<Cell><Data ss:Type="String">Mirano (VE)</Data></Cell>
<Cell><Data ss:Type="String">2000-02-08</Data></Cell>
<Cell><Data ss:Type="String">Via xx, 10</Data></Cell>
<Cell><Data ss:Type="String">00000</Data></Cell>
<Cell><Data ss:Type="String">xxx</Data></Cell>
<Cell><Data ss:Type="String">xxx mmm</Data></Cell>
</Row>
</Table>
...
</Worksheet>
</Workbook>
セルの内容を処理するには、python xmlファイルを読む必要があります。 私はminidomを使用しますが、セルの内容を行単位で正しくインポートすることはできません。
私はこのコードを書いたが、私は、文字列を抽出することはできません。
from xml.dom import minidom
xmldoc = minidom.parse("xxx.xml")
itemlist=xmldoc.getElementsByTagName('Row')
for s in itemlist :
item=s.getElementsByTagName('Cell')
print item
誰も私を助けるために方法を知っていますか?私はこれが誰かの役に立つことを願って
from xml.dom import minidom
xmldoc = minidom.parse("D:\xxx.xml")
itemlist=xmldoc.getElementsByTagName('Row')
bambino=0
for rows in itemlist :
item=rows.getElementsByTagName('Cell')
for Celle in item:
for child in Celle.childNodes:
print child.childNodes[0].nodeValue
:私はこのようにそれを解決し、あなたに