Google Playstoreを削っています。Python - XPathを使用したWebスクラップ
<div class="quoted-review">
<div class="review-text"> <span class="review-title">Awesome :)</span> Trying to learn some basic Lithuanian and pictures are very helpful. I'd love to learn more from who created this app.. &lt;3
<div class="paragraph-end details-light"></div>
</div>
</div>
私は、XPath、すなわち恐ろしい:)を使用して、クラスquoted-review
内部の完全なテキストを抽出したい - :私は以下のようにHTMLテキストを(ユーザーのコメント)しました。いくつかの基本的なリトアニア語と絵を学ぼうとするのはとても役に立ちます。私はこのアプリを作った人からもっと学びたいと思っています。& lt; 3。
後
は私たxPath1)//div[@class='quoted-review review-text']/span[@class='review-title']/text()|//div[@class='quoted-review review-text']/text()
は、私は1つのアイテムとしてそれらの両方を望んリスト
[
'Awesome :)' ,
'Trying to learn some basic Lithuanian and pictures are very helpful. I'd love to learn more from who created this app..'
]
を得ています。 PS:forループを使用してインデックス0と1を連結するようアドバイスしてください。 Xpathを使ってそれらを直接抽出してほしい。
2)//div[@class='review-text']/text()
利回りだけ
[
'Trying to learn some basic Lithuanian and pictures are very helpful. I'd love to learn more from who created this app..'
]
恐ろしい:)を逃しています。
私はBeautifulSoupを通してsoup.select('.quoted-review')[1].getText()
を1つとして直接使用できますが、Xpathは使用できません。
何が間違っていますか? XPathのバージョン1.0(バージョンlxml
実装していること)で
XPath、 'lxml'を実行するのにあなたは何を使いますか? – har07
@ har07 - はい... \ – PythonEnthusiast