2016-08-02 3 views
1

html urlをローカライズするためのnpmパッケージを作成します。
1. html urlを使用してhtmlページをダウンロード
2. htmlファイルを解析し、htmlとlocalのこれらのリソースで使用されているjs、css、imgファイルをすべて抽出します。
3.これらのjs、css、imgファイルが外部リソースを使用している場合は、これらのリソースをローカライズします。たとえば、CSSで背景イメージを抽出します。htmlファイルで使用されているすべてのjs cssとimgリソースを集めます。

第1および第2の要件は容易に満たすことができます。しかし、私は最後のものについては分かりません。 すべてのcssファイルを解析し、それに使用されているリソースをローカライズすることができます。しかし、どのようにjsファイルを解析できますか?
例: jsがhtml domに 'script src = XXX'タグを追加すると、どのようにsrcを抽出できますか?

答えて

0

コードを解析するのではなく、すべてのネットワーク呼び出しをキャッチするためにヘッドレスブラウザを使用しようとします。

私は個人的に使用していませんでしたが、PhantomJSは法案に適合しているようです。

これは、Webページをロードし、通常はリクエストで発生するスクリプト/ CSSを実行し、ページが読み込まれると実行します。

network monitoring featuresはおそらくあなたが使いたいものです。

+0

ファイルを解析しない場合、外部ファイルの外部リソースのURLを新しいローカルリソースのURLに変更できますか?たとえば、

関連する問題