2016-07-01 4 views
0

を使用する私のコードです:imacrosのスクラップのURLはこちらのXPath

SET !LOOP 1 
TAG XPATH=".//*[@id='rso']/div/div[{{!LOOP}}]/div/h3/a" EXTRACT=HREF 
TAG XPATH=".//*[@id='rso']/div/div[{{!LOOP}}]/div/h3/a" EXTRACT=TXT 
SAVEAS TYPE=EXTRACT FOLDER=* FILE=google_search.txt 

それを修正する方法は?この全体のxpathが間違っているかもしれません。このコードはGoogle検索をスクラップします。

+0

こんにちは、歓迎、StackOverflowへ。ヘルプページ、特に[ここではどのトピックについて聞かせていただけますか?](http://stackoverflow.com/help/on-topic)と[質問しないでください。」](http://stackoverflow.com/help/dont-ask)。さらに重要なことは、[Stack Overflow question checklist](http://meta.stackexchange.com/q/156810/204922)をお読みください。また、[最小、完全、および検証可能な例](http://stackoverflow.com/help/mcve)についても知りたいことがあります。 – lokusking

答えて

0

多くのGoogle検索結果ページでは、このxpathで複数の要素が表示されます。

.//*[@id='rso']/div/div[1]/div/h3/a 

または

.//*[@id='rso']/div/div[2]/div/h3/a 

しかしimacrosのは、XPathのこの種類をサポートしていません。私はあなたのためのより良い解決策を持っています。次のコードを試してください。

SET !TIMEOUT_STEP 0 
SET !ERRORIGNORE YES 
SET !EXTRACT_TEST_POPUP NO 
SET !LOOP 1 

TAG POS={{!LOOP}} TYPE=H3 ATTR=CLASS:r EXTRACT=TXT 
TAG POS=1 TYPE=A ATTR=TXT:{{!EXTRACT}} EXTRACT=HREF 

SAVEAS TYPE=EXTRACT FOLDER=* FILE=google_search.csv 

このコードは問題なく機能しました。

関連する問題