lxml

    6

    2答えて

    lxml.objectifyを使用して、XMLファイルを簡単に解析して使用できます。監査の理由から、派生オブジェクトを要素の元のXMLコードと共に保存する必要があります。 root = lxml.objectify.fromstring(self.get_xml_data()) for i, elem in enumerate(root.elements): # create new

    0

    2答えて

    Python 2.7a3を使用してOS X 10.6にlxmlをインストールしようとしています。しかし、私はインストールのセットアップ中にエラーが発生しています:ImportError:名前をインポートできません_config_vars 私は端末の出力を入れましたhere。 ありがとうございました。

    3

    1答えて

    lxmlのドキュメントから、私はカスタムXML要素がElementBaseから継承されるべきだと理解しています。 たとえば、私が作成することができ class FactVariable(etree.ElementBase): ''' Class that represents a XBRL fact variable.''' TAG = '{http://xbrl.org/20

    0

    1答えて

    でXPathエントリからテキストを取得し、私はウェブサイト http://www.baseball-reference.com/players/event_hr.cgi?id=bondsba01&t=b とテーブルからデータをこすりしようとしているにしています。私は1つのエントリからXPathを引くと、投手 が言う「テリーマルホランドを、」私はこれを取得: pitchers = site.xpat

    5

    4答えて

    を使用してから外側のタグを削除 <div id='productDescription'> <THE HTML CODE I WANT> </div> コードは、素晴らしい作品私のhtmlコードのすべてを与えるが、どのように私は<div id='productDescription'>すなわち外層と終了​​タグ</div>を削除するには:次のようになりますタグを持っていますか?

    1

    1答えて

    私は自分のコンピュータにlxmlをインストールしようとしていますが、問題があります。誰も助けることができますか?私は 'easy_install lxml'を実行しようとしているときに、私が得ている端末出力を提供しました。私はMac OS X 10.5とPython 2.7.2を使っています。おかげで!: Macintosh-8:~ momdad$ easy_install lxml Searc

    1

    1答えて

    私はlxmlを使ってhtmlをスクラップしています。このコードは機能します。 lxml.html.parse("http://google.com/") このコードはありません。 lxml.html.parse("http://google.com") なぜURLの末尾にスラッシュが入りますか?ありがとうございました。 ここでは、pythonが後者のコードから私に与えているエラーログを示し

    0

    2答えて

    この問題があります。元のソースファイルはmhtml形式のlxmlを使用して処理しています。これらはExcelファイルです。私はヘッダー要素 'th'要素を含む行を見つける必要があります。私はヘッダ要素を使いたいが、順番どおりにすべてを処理するためには、ヘッダ要素を必要とする。 私がしてきたことは、th要素のすべてを見つけ出し、e.getparent()関数を使って行を取得することです(行の子である

    4

    2答えて

    私はpythonでlxmlライブラリを使って、GoogleのデータAPIのいくつかを使っています。名前空間はここでは大変面倒です。私がやっている仕事の多くは(主にxpathのもの)、それらを無視するだけでいいのです。 python/lxmlでxml名前空間を無視する簡単な方法はありますか? ありがとうございました!

    0

    1答えて

    私はlxmlを使用して、Webページから文字列を取得しています。以下のエラーが出ることなく抽出するデータの文字列を取得するにはどうすればよいですか?私はちょうどstr()を使って問題を解決できないと思う。 Pythonで : mystring = MySQLdb.escape_string(i.text_content()) (<type 'exceptions.UnicodeEncodeE