lxml

6熱

2答えて

lxml.objectifyを使用して、XMLファイルを簡単に解析して使用できます。監査の理由から、派生オブジェクトを要素の元のXMLコードと共に保存する必要があります。 root = lxml.objectify.fromstring(self.get_xml_data()) for i, elem in enumerate(root.elements): # create new

0熱

2答えて

OS X 10.6にlxmlをインストール中にImportErrorを実行する

Python 2.7a3を使用してOS X 10.6にlxmlをインストールしようとしています。しかし、私はインストールのセットアップ中にエラーが発生しています：ImportError：名前をインポートできません_config_vars 私は端末の出力を入れましたhere。ありがとうございました。

3熱

1答えて

lxml.ElementBaseから継承するオブジェクトの名前空間接頭辞をカスタマイズする方法

lxmlのドキュメントから、私はカスタムXML要素がElementBaseから継承されるべきだと理解しています。たとえば、私が作成することができ class FactVariable(etree.ElementBase): ''' Class that represents a XBRL fact variable.''' TAG = '{http://xbrl.org/20

0熱

1答えて

トラブルのpython

でXPathエントリからテキストを取得し、私はウェブサイト http://www.baseball-reference.com/players/event_hr.cgi?id=bondsba01&t=b とテーブルからデータをこすりしようとしているにしています。私は1つのエントリからXPathを引くと、投手が言う「テリーマルホランドを、」私はこれを取得： pitchers = site.xpat

5熱

4答えて

のPython、lxmlのとlxml.html.tostring（エル）

を使用してから外側のタグを削除 <div id='productDescription'> <THE HTML CODE I WANT> </div> コードは、素晴らしい作品私のhtmlコードのすべてを与えるが、どのように私は<div id='productDescription'>すなわち外層と終了タグ</div>を削除するには：次のようになりますタグを持っていますか？

1熱

1答えて

easy_install lxml os x 10.5

私は自分のコンピュータにlxmlをインストールしようとしていますが、問題があります。誰も助けることができますか？私は 'easy_install lxml'を実行しようとしているときに、私が得ている端末出力を提供しました。私はMac OS X 10.5とPython 2.7.2を使っています。おかげで！： Macintosh-8:~ momdad$ easy_install lxml Searc

1熱

1答えて

lxml.html.parse（）の最後にあるスラッシュが重要なのはなぜですか？

私はlxmlを使ってhtmlをスクラップしています。このコードは機能します。 lxml.html.parse("http://google.com/") このコードはありません。 lxml.html.parse("http://google.com") なぜURLの末尾にスラッシュが入りますか？ありがとうございました。ここでは、pythonが後者のコードから私に与えているエラーログを示し

0熱

2答えて

lxmlで要素をテストするときの円形性の回避

この問題があります。元のソースファイルはmhtml形式のlxmlを使用して処理しています。これらはExcelファイルです。私はヘッダー要素 'th'要素を含む行を見つける必要があります。私はヘッダ要素を使いたいが、順番どおりにすべてを処理するためには、ヘッダ要素を必要とする。私がしてきたことは、th要素のすべてを見つけ出し、e.getparent（）関数を使って行を取得することです（行の子である

4熱

2答えて

lxmlのすべての名前空間を削除しますか？

私はpythonでlxmlライブラリを使って、GoogleのデータAPIのいくつかを使っています。名前空間はここでは大変面倒です。私がやっている仕事の多くは（主にxpathのもの）、それらを無視するだけでいいのです。 python/lxmlでxml名前空間を無視する簡単な方法はありますか？ありがとうございました！

0熱

1答えて

Python、lxmlおよび<type 'exceptions.UnicodeEncodeError'>

私はlxmlを使用して、Webページから文字列を取得しています。以下のエラーが出ることなく抽出するデータの文字列を取得するにはどうすればよいですか？私はちょうどstr()を使って問題を解決できないと思う。 Pythonで： mystring = MySQLdb.escape_string(i.text_content()) (<type 'exceptions.UnicodeEncodeE