2016-09-05 13 views
-1

BeautifulSoupの "prettify"を使って最初と最後の1000行を印刷しようとしています。私はKafkaの変態をハードドライブにダウンロードしました。 BeautifulSoupオブジェクト作成:原因グーテンベルクサイトとキャプチャの問題に美しいスープで最初と最後の1000行を印刷するには

を、私は私のハードドライブ上の文書のコピーを保存して、私は1000年の最初と最後を印刷するsoup.prettify()を使用するにはどうすればよい

page = open('meta.htm', 'r').read() 
soup = BeautifulSoup(page, "lxml") 

。書類の行?

答えて

1

だけスライスそれら:

result = soup.prettify().splitlines() 
print('\n'.join(result[:1000] + result[-1000:])) 
+0

とてもうまくいきました。ありがとう!文書の最初の1000行の代わりに最初の1000文字を印刷したいだけの場合は、このコードを変更する必要がありますか? – James

+0

@James確かに、最初の1000の 'print( '\ n'.join(結果[:1000]))'と 'print(' \ n'.join(結果[-1000:]))'最後の1000日間 – alecxe

関連する問題