TripadvisorページからのXMLファイルがあり、特定のエリアにレストランが表示されます。XMLタグ間で複数の値を抽出します
検索結果に表示されているすべてのレストランから提供されている「料理」を抽出します。すべての値は、<a>
と<span>
HTMLタグの間に格納されます。各レストランの
<div>
タグの間保存され、1つのレストランから料理の抜粋を以下に示します。
<div class="cuisines">
<span class="item price">££ - £££</span>
<span class="item cuisine" onclick="ta.restaurant_list_tracking.clickNonLinkedCuisine()">Bar</span>
<a class="item cuisine" href="/Restaurants-g1096751-c7-Whittlebury_Northamptonshire_England.html" onclick="ta.setEvtCookie('RESTAURANT_DETAILS', 'RESTAURANTS_DETAILS_CUISINE', '', 0, this.href);">British</a>
<span class="item cuisine" onclick="ta.restaurant_list_tracking.clickNonLinkedCuisine()">Pub</span>
<span class="item cuisine" onclick="ta.restaurant_list_tracking.clickNonLinkedCuisine()">Gastropub</span>
<a class="item cuisine" href="/Restaurants-g1096751-zfz10665-Whittlebury_Northamptonshire_England.html" onclick="ta.setEvtCookie('RESTAURANT_DETAILS', 'RESTAURANTS_DETAILS_CUISINE', '', 0, this.href);">Vegetarian Friendly</a>
<a class="item cuisine" href="/Restaurants-g1096751-zfz10992-Whittlebury_Northamptonshire_England.html" onclick="ta.setEvtCookie('RESTAURANT_DETAILS', 'RESTAURANTS_DETAILS_CUISINE', '', 0, this.href);">Gluten Free Options</a>
</div>
がどのように私はそれぞれのこれらのdiv
タグの間に料理を抽出行くのですレストランを開き、それを新しいテキストファイルに出力しますか?
私はそのコードスニペットから望む予想される出力は次のようになります。あなたは、いくつかの<div>
タグは、このXMLファイルである、と私はそれらのすべてを処理したい、抽出
Bar, British, Pub, Gastropub, Vegetarian Friendly, Gluten Free Options
マインドすべての異なる料理の結果を1つのテキストファイルに変換します。それぞれの行に各<div>
ブロックのすべての料理が表示されます。
ありがとうございます!
は、いくつかの[xmlstarletタグ]などのXML処理ツールの研究を行いますライブラリ。 –
本当にXML、またはHTML? (ベースラインのHTML *はXMLのように見えますが、それほどコンプライアントではないため広く利用できるツールでは受け入れられません)。 –
私は、あなた自身のコードを使った援助の要求ではなく、ツールやソリューションの勧告の要求であるように見えるので、この質問を終えるように投票しました。これはあなたの質問をStackOverflowのトピックから外します。その評価が間違っていて、自分でコードを書くのを手助けしたいのであれば、[あなたの質問に今までの仕事を追加](https://stackoverflow.com/posts/45309055/edit)と私は喜んで引っ込めます私の近い投票。 – ghoti