私はPython 2.7.3とbsを持っています。Python BeautifulSoupがfind_all()から入力の間違ったリストを返す
input:<input name="fname" type="text">
<input name="email" type="text">
<input name="Submit" type="button" value="submit">
</input></input></input>
input:<input name="email" type="text">
<input name="Submit" type="button" value="submit">
</input></input>
input:<input name="Submit" type="button" value="submit">
</input>
何が起こった
input: <input name="fname" type="text">
input: <input type="text" name="email">
input: <input type="button" name="Submit" value="submit">
を返すことになっています:バージョンは、このコード
from bs4 import BeautifulSoup # parsing
html = """
<html>
<head id="Head1"><title>Title</title></head>
<body>
<form id="form" action="login.php" method="post">
<input type="text" name="fname">
<input type="text" name="email" >
<input type="button" name="Submit" value="submit">
</form>
</body>
</html>
"""
html_proc = BeautifulSoup(html, 'html.parser')
for form in html_proc.find_all('form'):
for input in form.find_all('input'):
print "input:" + str(input)
は、入力の間違ったリストを返すいくつかの理由4.4.1
です?
ありがとうございました。これは機能します。私はで入力を終了しなければならないのは奇妙なことです。標準HTMLコードではないからです。 https://www.w3schools.com/tags/tag_input.asp誰かがこれを適切な人に報告できるのであれば、それは大歓迎です。 – Arrow
@Arrow - バグを報告することから始めます。https://bugs.launchpad.net/beautifulsoup/ – mgilson