0
最大100K文字の文字列を扱い、csvファイルに異なる列に書きたい。以下は分割されたhtml文字列を分割する
(基本的には32KのExcelのセルの限界を克服しようとする)のサンプルコードです:
soup = BeautifulSoup(r.content, 'html5lib')
html = str(soup.select('div.DocumentText'))
if len(html) > 32000:
#How to handle here and assign to different variable ex: html1, html2 is the question
x.writerow([html_1,......, html_5])
例が達成しようとして流れ
- スクラップウェブサイト
- 廃棄データ文字がより大きい場合32000以上100K未満
- 廃棄物を異なる変数に分割
- 各変数をCSVファイルの異なる列に書き込む
件までのみcase_html(文字列)の長さを扱うことができている、あなたがしたいことを意味しています'c.case_html'をサイズ32kのアイテムに分割しますか? – chowsai
html入力の例と取得したいcsv出力を投稿してください。 – JoshRomRock
スプリットは単語境界で行う必要がありますか? –