ウェブサイト(http://www.gfrvitale.altervista.org/index.php/autismo-in?format=feed&type=rss)からrssフィードを削っています。 私はすべてのフィードからテキストを抽出して整形するスクリプトを書きました。私の主な問題は、各項目の各テキストを別のファイルに保存することです。また、それぞれのファイルに適切なタイトルのexctractetを付ける必要があります。 私のコードは次のとおりです。複数の出力を複数のファイルに保存するにはどうすればいいですか?各ファイルのタイトルはPythonのオブジェクトとは異なりますか?
for item in myFeed["items"]:
time_structure=item["published_parsed"]
dt = datetime.fromtimestamp(mktime(time_structure))
if dt>t:
link=item["link"]
response= requests.get(link)
doc=Document(response.text)
doc.summary(html_partial=False)
# extracting text
h = html2text.HTML2Text()
# converting
h.ignore_links = True #ignoro i link
h.skip_internal_links=True #ignoro i link esterni
h.inline_links=True
h.ignore_images=True #ignoro i link alle immagini
h.ignore_emphasis=True
h.ignore_anchors=True
h.ignore_tables=True
testo= h.handle(doc.summary()) #testo estratto
s = doc.title()+"."+" "+testo #contenuto da stampare nel file finale
tit=item["title"]
# save each file with it's proper title
with codecs.open("testo_%s", %tit "w", encoding="utf-8") as f:
f.write(s)
f.close()
エラーは次のとおりです。
File "<ipython-input-57-cd683dec157f>", line 34 with codecs.open("testo_%s", %tit "w", encoding="utf-8") as f:
^
SyntaxError: invalid syntax
、私はこのエラーを取得する:C:\ Anaconda2 \ libに\コーデック.pyc in open(ファイル名、モード、エンコーディング、エラー、バッファリング) 894#バイナリモードでのファイルの強制オープン 895 mode = mode + 'b' - > 896 file = __builtin __。openバッファリング) エンコードされていない場合は897、 898リターンファイル IOError:[Errno 22]無効なモード( 'wb')またはファイル名:u'testo_La Comunicazione Facilitata? Parliamone。 – CosimoCD
コードが正しいです。カンマはターゲットではなく、 '%tit'の後にあります。それは別のエラーです。私が確認しておきます、チェックします。 – estebanpdl
希望の出力は何ですか? (つまり、 '.csv'、' .txt') – estebanpdl