テーブルタグ内のHTMLコードからテキストを取得しようとしていますが、text.Insteadをすべて取得できません。ここでbeutifulsoupを使ってHTMLテーブルからテキストを取得する際にエラーが発生し、機械化する
は私の出力とのコードです:
出力
Public Sector Organization (Recruitment Test)
Test held on: Saturday, 3rd & Sunday 4th, December 2016
>>>
コード
import mechanize
from bs4 import BeautifulSoup
import urllib
from PIL import Image
import os
Roll=60170001
url = "http://nts.org.pk/Test&Products/Results/012017/PubSecOrg_24122016_Result/Search.php"
br = mechanize.Browser()
br.set_handle_robots(False) # ignore robots
br.open(url)
br.select_form(nr=0)
rollnumber=str(Roll)
captcha=11111
cap=str(captcha)
br["RollNo"]=rollnumber
br["captcha"]=cap
res = br.submit()
content = res.read()
soup = BeautifulSoup(content,"html.parser")
rolln=soup('table')[2]
rolln=rolln.text.encode('utf-8')
print rolln
要求された出力は何ですか? –
原則として、私の出力は表[2]の中の全文でなければなりません。これは多少です。公共部門組織(募集テスト) テスト開催日:2016年12月4日(土曜日)、第3日曜日と第12日(結果) アップロード日付:水曜日、キーワード60170001 ロールません 名 父の名前 CNIC ポスト NTSマークス MUMTAZ ALI RAHMANワリ 16101-1938424-7 講師(BPS-17)(のための2016年11月23日の検索結果電子機器) 67現在の日付/時刻:Wednesday 22th、2017年2月、09:30:48 PM – Mumtaz