XMLファイルからテキストを解析しています。構文解析はうまく動作し、結果を完全に印刷することができますが、テキストをテキスト文書に書き込もうとすると、ドキュメントに入っているのは最後の項目だけです。Python - 解析されたXMLをtxtファイルにエクスポート
from bs4 import BeautifulSoup
import urllib.request
import sys
req = urllib.request.urlopen('file:///C:/Users/John/Desktop/Dow%20Jones/compaq%20neg%201.xml')
xml = BeautifulSoup(req, 'xml')
for item in xml.findAll('paragraph'):
sys.stdout = open('CN1.txt', 'w')
print(item.text)
sys.stdout.close()
私はここで何が欠けていますか?
'sys.stdout'を上書きするとサポートされていますが、これは普通ではありません。ファイルハンドルを別の名前で保存しておかないとか、 'f.write()'などを使っている理由はありますか? –
ところで、この質問にはXML特有のことは何もありません。たとえば、["hello"、 "cruel"、 "world"]: 'のアイテムの場合、XMLに関連するコードはまったく存在しないため、単純化することができます。最後の文字列は現在の出力ファイルで繰り返されていました)。 –
私はXMLで作業し、Pythonから書くのはまったく新しいです。私はRと似ていますが、Pythonではありません。 – John