2017-01-29 4 views
0

html.Parse(r io.Reader)を使用してドキュメントを解析した後、ノードツリーが取得されます。各DOMノードは、その周囲、タグの名前、およびそのタグの属性を提供します。 See herenet/htmlから完全なタグ/行番号を取得

ノードオブジェクトからファイルrのノードの文字列テキストに移動する最善の方法と、そのファイル内のそのタグの行番号は何ですか?

答えて

0

htmlパッケージはその情報を記録しないため、利用できません。

+0

私はそれを認識しています。私が求めているのは、これを回避する最良の方法は何かです。 htmlパッケージを拡張できるか、それをforkしてその機能を追加する必要がありますか?私たち独自のトークナイザーを書くことで可能でしょうか? – wjdp

+0

それをフォークして、トークンとノードの両方に位置情報を追加し、ノードが作成されたどこにでも関連するトークンから位置情報をコピーする必要があります。 – andybalholm

関連する問題