私は2012年のオバマ・ロムニー大統領議論から引用を抽出しようとしています。問題はthe siteで整理されていません。だから、構造は次のようになります。あなたの子供や兄弟に応じてBeautifulSoupを使ってタグを選択するにはどうすればよいですか?
<span class="displaytext">
<p>
<i>OBAMA</i>Obama's first quotes
</p>
<p>More quotes from Obama</p>
<p>Some more Obama quotes</p>
<p>
<i>Moderator</i>Moderator's quotes
</p>
<p>Some more quotes</p>
<p>
<i>ROMNEY</i>Romney's quotes
</p>
<p>More quotes from Romney</p>
<p>Some more Romney quotes</p>
</span>
は、最初の子、あなたがその最初の子i
で次のp
を打つまではp
兄弟だテキストOBAMA
し、すべてを持っているi
ある<p>
を選択する方法はありますテキストはありませんObama
??ここで
私がこれまで試したものですが、それだけで私だけがfinite state machine様液の種類はここで働いなると思いObama's first quotes