2016-03-23 23 views
0

Webページのセットからテキストを取得しようとしていますが、取得したいテキストの一部がタグで囲まれていません。残りの内容は簡単に取り出すことができますが、すべてのページに二重引用符で囲まれたテキストの段落しかありません。 現在、私はそれが存在する要素を見つけることができますが、その要素には他の多くのコンテンツがありますので、この要素に入り、二重引用符で囲まれたテキストを排他的に取得するxpathを指定できますか?Selenium - 二重引用符で囲まれたテキストのみを検索する

編集: 以下は、h1タグの下の2行のテキストを取得したいものです。要素には多くの要素がありますが、関連性はありません。だから、私が探しているXPathは、 『ウィジェットコンテンツ「クラスで記事-要素内の任意囲まれていないテキストを検索』の線に沿って何かある

<article class="widget-content"> 
 
    
 
<meta http-equiv="Content-Type" content="text/html; charset=utf-8"> 
 
<script src="/Modules/Orchard.jQuery/scripts/jquery-1.9.1.js" type="text/javascript"></script> 
 

 

 
    <h1>Placeholder title</h1> 
 
Placeholder text Placeholder text Placeholder text Placeholder text Placeholder text Placeholder text Placeholder text Placeholder text Placeholder text Placeholder text Placeholder text Placeholder text Placeholder text <br /> 
 
    <br /> 
 
Placeholder: Another placeholder <br /> 
 
    <br />

+1

はあなた –

+0

私は今、いくつかのコードを追加したために問題を作成し、あなたの要素の例とHTMLコードを投稿してくださいすることができ、@ShubhamJain – user3630098

+0

あなたは、あなたが話している引用符を持っていません。 "見つからないものを見つける..."という行も欠けている。 –

答えて

0

Q:だから、私が探しているXPathはウィジェットコンテンツ 『「クラスを使用して記事-要素内の任意囲まれていないテキストを検索』の線に沿って何かある
これは次のようになります。

//article[@class='widget-content']/text() 

しかし、これは彼らが試す避けるために、空のテキストノードの戦利品を(空白文字のみ)が含まれます:

//article[@class='widget-content']/text()[normalize-space() !=''] 

Q:以下は、私は、H1-以下の2行のテキストを取得したいものですタグ。

これは、すべて一緒に(/h1/following-sibling::text())、またはなります

"//article[@class='widget-content']/h1/following-sibling::text()[normalize-space() !='']" 
0

はこのようなものになるshoud:。

0

あなたxpath

xpath=//article[contains(@class, 'widget-content')]/article[1] 
はこのようなものでなければなりません:

//article/text() 

それが出力のみtagの外にあるテキスト。

希望すると助かります!

関連する問題