2010-12-17 7 views
0

私はウェブサイトでやっている仕事の一部として、古いサイトのいくつかのページから数千行のテキストをコピーして、新しいサイト。古いページに行き、多くの行のテキストをコピーしてから私のエディタに行き、そこに1行ずつ貼り付けるという、辛抱強くやっかいな方法は本当に古くなってきています。私は、これを行うために注入されたJavaScriptを使用することを考えましたが、私はどこから始めたらよいか分かりません。助けを前にありがとう。JavaScriptを使ってウェブページからテキストをコピーする

ここには、古いサイトのページと新しいサイトのページへのリンクがあります。各ページの表でわかるように、手動ですべてコピーするには時間がかかります。

旧サイト:http://temp.delridgelegalformscom.officelive.com/macorporation1.aspx

新規サイト:私はあなたがこの種の作業を行うためにhttp://www.greasespot.net/

+0

フォーマットなどについて教えてくれるHTMLを投稿できますか? – Qix

+0

私は私の質問に取り組んでいる2つのサイトへのリンクを追加しました。 – Blake

+0

あなたはサーバーにアクセスできますか?なぜあなたはサイトから必要なものをコピーするUnix/DOSスクリプトを書くことができませんか? –

答えて

2

グリースモンキーが必要だと思うhttp://ezwebsites.us/delridge/macorporation1.html

+1

また、ヘッダーに 'javascript:' URLディレクティブを使用するだけでもかまいません。すなわち 'javascript:alert(" hello ");' – Qix

1

、あなたは二つのことを必要とする:注入の方法をかそのページでスクリプトを実行し、ターゲットサイトのドキュメントオブジェクトモデルの実用的な知識が必要です。

FirefoxのプラグインFireBugまたは同等のツールを使用することをお勧めします。 FireBugを使用すると、JavaScriptコンソールからコマンドを実行できます。うまくいけば、古いサイトには<FONT><OBJECT>または<IFRAME>タグの束がないので、これはさらに面倒です。

PrototypeやJQueryのようなライブラリを使用すると、必要なWebサイトの一部を選択するのに役立ちます。あなたはこのようにjQueryのを使用して結果を提出することができます:

$(function() { 
    snippet = $('#content-id').html; 
    $.post('http://myserver/page', {content: snippet}); 
}); 

あなたは可能性が非常に高いという問題の実行には、「同じ発信ポリシー」多くのブラウザはJavaScriptが強制です。したがって、この例のようにJavaScriptが​​からロードされていればOKです。

RubyやPythonのようなスクリプト言語を使用することも、実際には辛抱強いことがあればVBAを使用することもできます。スクリプトは、掻き取るページのリストと情報のターゲット位置を自動化できます。新しいサーバーへのリクエストとしてページを更新する方法があれば、それを簡単にパッケージ化することもできます。この方法では、JavaScriptを注入することを心配する必要はなく、問題なくすべての作業を期待できます。

+1

グリースモンキースクリプトは、同じ起源の問題をバイパスすることに同意します。 firefoxにウェブサイトをロードして、HTMLをスクラップするスクリプトを実行するだけです。 –

関連する問題