html-parsing

    1

    1答えて

    iTunesのアプリのURLからアイコンやスクリーンショットの画像を取得しようとしていますが、特定のアプリのスクリーンショットしか取得できません。アイコンの場合、私はすべてのアプリのために次のURLをhttps://s.mzstatic.com/htmlResources/ef35/frameworks/images/p.pngに取得します.Googleの再生の場合アイコンとスクリーンショットの両

    0

    1答えて

    PHPを使用してHTMLからすべてのオプションを選択ドロップダウン全体を削除する必要があります。 私はpreg replaceとすると思いますが、そのように使用する方法はわかりません。 すべてのhtmlは変数です。に変換 $html = " <p> something </p> <select name='bla' id='bla' class='REMOVE'> <option></o

    -3

    2答えて

    私は本当に多くのオフラインhtmlファイルを持っています。私はそれらの名前、アドレスなどから取得する必要があります。そしてCSVを作成します。私はどのように良い方法がなければならないと思います...は for /r %%i in (*) DO ( findstr /o "name" %%i >> results.txt ECHO ; >> results.txt fi

    1

    1答えて

    Codeigniterを初めて使用しています。私はフォーム用のテンプレートを作成し、それをビューファイル内で解析したいと思っています。それは解析されますが、ページの上部に解析されたフォームが表示されます。私はページ全体にテンプレートを使用していません。私はパーサーを使ってページの平和を表現したい。 <form action = {action}> <select name = {input_n

    1

    1答えて

    私は、ドメイン内のすべてのオーディオタグを解析し、発見された各オーディオタグからそれぞれaudio/mpegコンテンツをダウンロードしようとPerlでクモを記述しようとしています。以下は aタグからリンクを抽出するためにHTMLを解析するHTML::TokeParserを使用して私のコードからの抜粋です: my($response, $base, $stream, $pageURL, $tag,

    0

    1答えて

    私はスパンタグからテキストを取得したいが、私はそのような問題がある。私はこれを書いた 、 import bs4 as bs import urllib.request page = urllib.request.urlopen('http://www.accuweather.com/en/az/baku/27103/current-weather/27103').read() soup

    2

    2答えて

    メタタグの内容を取得しようとしています。問題は、BS4が、タグが閉じられていないサイトでは、タグを適切に解析できないことです。以下の例のようなタグを使用すると、私の関数の出力にスクリプト、リンクなどの他のタグを含む混乱がたくさん含まれています。 私のコードはこれで動作します。 <meta name="description" content="content" /> とでは動作しません。ここで

    1

    2答えて

    私はhttp://www.basketball-reference.com/teams/CHI/2015.htmlからrvestを使用して掻き取ろうとしています。私はselectorgadgetを使用して、必要なテーブルに対して#advancedされるタグを見つけました。しかし、私はそれを拾っていないことに気づいた。ページソースを見ると、テーブルがhtmlコメントタグ内にあることに気付いた。<!-

    0

    2答えて

    リスト要素を取得します。 <li class="myclass"> <ul class="myclass2"> <li><span>Name1</span><span>Value1</span></li><li><span>Name2</span><span>Value2</span></li><li><span>Name3</span><span>Value3</s