html-parsing

1熱

1答えて

SimpleHTMLDOMパーサーを使用して、iTunesからアプリケーションのアイコン画像を取得しています

iTunesのアプリのURLからアイコンやスクリーンショットの画像を取得しようとしていますが、特定のアプリのスクリーンショットしか取得できません。アイコンの場合、私はすべてのアプリのために次のURLをhttps://s.mzstatic.com/htmlResources/ef35/frameworks/images/p.pngに取得します.Googleの再生の場合アイコンとスクリーンショットの両

0熱

1答えて

<select>をPHPでhtmlから削除

PHPを使用してHTMLからすべてのオプションを選択ドロップダウン全体を削除する必要があります。私はpreg replaceとすると思いますが、そのように使用する方法はわかりません。すべてのhtmlは変数です。に変換 $html = " <p> something </p> <select name='bla' id='bla' class='REMOVE'> <option></o

-3熱

2答えて

HTMLオフラインファイルは内容を取得します

私は本当に多くのオフラインhtmlファイルを持っています。私はそれらの名前、アドレスなどから取得する必要があります。そしてCSVを作成します。私はどのように良い方法がなければならないと思います...は for /r %%i in (*) DO ( findstr /o "name" %%i >> results.txt ECHO ; >> results.txt fi

1熱

1答えて

ビューのコードネームを解析する

Codeigniterを初めて使用しています。私はフォーム用のテンプレートを作成し、それをビューファイル内で解析したいと思っています。それは解析されますが、ページの上部に解析されたフォームが表示されます。私はページ全体にテンプレートを使用していません。私はパーサーを使ってページの平和を表現したい。 <form action = {action}> <select name = {input_n

1熱

1答えて

HTMLを使用して解析HTML形式のオーディオタグに:: TokeParser

私は、ドメイン内のすべてのオーディオタグを解析し、発見された各オーディオタグからそれぞれaudio/mpegコンテンツをダウンロードしようとPerlでクモを記述しようとしています。以下は aタグからリンクを抽出するためにHTMLを解析するHTML::TokeParserを使用して私のコードからの抜粋です： my($response, $base, $stream, $pageURL, $tag,

0熱

1答えて

<span>から美味しいスープ

私はスパンタグからテキストを取得したいが、私はそのような問題がある。私はこれを書いた、 import bs4 as bs import urllib.request page = urllib.request.urlopen('http://www.accuweather.com/en/az/baku/27103/current-weather/27103').read() soup

2熱

2答えて

BS4で閉鎖されていないメタタグを掻き集める

メタタグの内容を取得しようとしています。問題は、BS4が、タグが閉じられていないサイトでは、タグを適切に解析できないことです。以下の例のようなタグを使用すると、私の関数の出力にスクリプト、リンクなどの他のタグを含む混乱がたくさん含まれています。私のコードはこれで動作します。 <meta name="description" content="content" /> とでは動作しません。ここで

1熱

2答えて

コメントタグ内のテーブルをRでHTMLでスクレイプする方法は？

私はhttp://www.basketball-reference.com/teams/CHI/2015.htmlからrvestを使用して掻き取ろうとしています。私はselectorgadgetを使用して、必要なテーブルに対して#advancedされるタグを見つけました。しかし、私はそれを拾っていないことに気づいた。ページソースを見ると、テーブルがhtmlコメントタグ内にあることに気付いた。<!-

0熱

2答えて

私はこのようなHTMLの一部を持っている場合、HTML解析

リスト要素を取得します。 <li class="myclass"> <ul class="myclass2"> <li><span>Name1</span><span>Value1</span></li><li><span>Name2</span><span>Value2</span></li><li><span>Name3</span><span>Value3</s