に変換するには、XMLを解析私はこのようなxmlファイルを持っている:は、ヘッダーをスキップし、JSON
"HTTP/1.1 100 Continue
HTTP/1.1 200 OK
Expires: 0
Buffer: false
Pragma: No-cache
Cache-Control: no-cache
Server: Transaction_Server/4.1.0(zOS)
Connection: close
Content-Type: text/html
Content-Length: 33842
Date: Sat, 02 Aug 2014 09:27:02 GMT
<?xml version=""1.0"" encoding=""UTF-8""?>
<creditBureau xmlns=""http://www.transunion.com/namespace"" xmlns:xsi=""http://www.w3.org/2001/XMLSchema-instance"">
<document>response</document>
<version>2.9</version>
<transactionControl><userRefNumber>Credit Report Example</userRefNumber>
<subscriber><industryCode>Z</industryCode></subscriber></transactionControl>
これは、文書全体のほんの一部です。私はこれをjsonに変換したい。 問題は、ヘッダー部分をスキップまたは削除し、<document>
タグから始まるように、実際のxmlから解析を開始する方法です。
このようなファイルは100万以上あります。私は手動で行うことはできません。どうしたらいいですか?どんな助けもありがたい。
私はウェブサイトを取得していません。私はこのデータをトランニュオンから得る。だから、私はそれをテキストファイルとして読んで、reg expを使ってxmlの部分を選択するということです。 –
それは私がやることです。しかし、より良い方法があるかもしれません。私はPythonでそれほど良くありません。 – darthzejdr