lxml

3熱

3答えて

私のDjangoアプリケーションのデプロイされたバージョンを使用しているとき、私はlxmlのと奇妙な問題を抱えています。私はlxmlを使って自分のサーバから取り出した別のHTMLページを解析します。これは自分のコンピュータ上の開発サーバー上ではうまく動作しますが、なんらかの理由でサーバー上にUnicodeDecodeErrorと表示されます。 ('utf8', "\x85why hello the

1熱

5答えて

Python lxmlのスクリーンスクレイピング？

私はPythonでいくつかのHTML解析を行う必要があります。いくつかの研究の後、lxmlは私の最良の選択だと思われますが、私は何をしようとしているのかを助けてくれる例を見つけるのに苦労しています。これが私が聞いている理由です。私は、すべての表示可能なテキストのすべてのページをこすりする必要があります..すべてのタグとjavascriptを外します。私はそれを私はどのテキストが表示可能なままにする

1熱

3答えて

Pythonのイテレータヘルプ+ lxmlの

私はあなたがループのために、私は事前に設定した回数の後に停止した見ることができるように、これは import lxml from lxml.cssselect import CSSSelector from lxml.etree import fromstring from lxml.html import parse website = parse('http://example.

4熱

1答えて

Pythonのlxmlを使ってエンティティ名の代わりにxml文書のエンティティ番号を印刷するにはどうしたらいいですか？

xmlドキュメントを生成するのに（etree.tostring（root）を使用するだけで）xmlドキュメントを生成していますが、結果のxmlは数値（&＃）ではなく名前付きエンティティ（& lt; 60;）。どのように正確に結果を名前の代わりに数値を使用するように変更するつもりですか？おかげ