1
私はrequests
とbs4
を使いました。サークルでは、私はすべての 'スープ'を取得するときに最後の 'スープ'が正しいことがわかりました。他の 'スープ'はHTMLソースとは異なります。私を助けてください。ありがとう。ウェブクローラのpython(複数のウェブサイト)
for eachLine in files:
addr = 'http://neuromorpho.org/neuron_info.jsp?neuron_name='+eachLine
print addr
st = []
st1 = []
r2 = requests.get(addr)
soup2 = bs4.BeautifulSoup(r2.text,"lxml")
print soup2