2009-04-27 5 views
2

非常に似ているWebページの大きな束をより新しいCSSベースのレイアウトにプログラムで変換する最良の方法は何ですか?同様の虚偽のHTMLページの大きなグループを高品質のCSSベースのページに変換するにはどうすればよいですか?

私は古いウェブサイトのすべてのコンテンツを新しいCSSベースのレイアウトに変更しています。ページの多くは非常に似ており、プロセスを自動化したいと考えています。

私が現在考えているのは、HtmlAgilityPackを使用してページを読み込み、出力テキストを作成する類似のページのグループごとにメソッドを作成することです。

これを行うにはどうすればよいと思いますか?ページは、画像に.jpgファイルが使用されているか、または特定のページにある見出し画像テキストのグループがいくつあるかによって大きく異なります。

EDIT:.html以外のファイルタイプは使用できません。それが私が行う権限のすべてです。助言がありますか?

EDIT2:理想的には、いくつかの可動部分を切り替えるだけで、htmlファイルのさまざまなグループに使用できるように、これを汎用的にすることもできます。

SAMPLE OF TYPICAL PAGE

上記のリンクは私が取り扱っておりますもののサンプルです。ページ間で異なるでしょう部分は次のようになります。

  • メタdescriptionタグ
  • 様々なヘッダ、especaillyメインヘッダ
  • ほとんどのページ上のすべての画像は、各ビデオのための
  • 新しいテキストになりますユニークになりますが、彼らは同様のチャンクで一緒に
  • ビデオファイルをグループ化され、ビデオのサイズが一意になります

他のすべては同じで、ページのフォーマットも同じです。

EDIT3:疑問がある場合は、私にとってページを書くコードを書くことが参考になるかもしれません。私は可変であるオリジナルの部分を切り取って、それらを新しいバージョンを読むために読み込まれて使用されるデータファイルに入れるだけです。

+0

典型的なページのサンプルを提供し、その違いがどこで発生しているのかを明確にしておけば、扱うページの種類を知ることができます。 .. –

+0

よろしくお願いします。 –

答えて

0

これは少し口が達者に聞こえるかもしれませんが、私が提供できる最高の現実的な選択肢はRent-A-Coder

+0

良いアイデアは、情報が独自のものではないと仮定すると、誰かに$ 50を支払ってから自分の時間を費やすのが早いかもしれません。 – Jared

+1

もちろん、同じような愚かな_css_ページの大きなグループになりたいのであれば。 –

+0

はい、明らかに人と人との機械加工に適した仕事をするために人を雇う可能性は明らかです。ロール: –

0

だろうが、ページに依存、あなたは限り行うことで、あなたの快適なPerlでスクリプトや他のスクリプト言語を書くことができます彼らは解決できなかった、または理解できなかったことに気づかせてください。

1

それは実際にどれほど類似しているかによって異なります。彼らが効果的にいくつかのテンプレートを使用しているという場合は、Template-Toolkitを使用して新しいデザインの新しいテンプレートを作成し、Template::Extractを使用してデータを吸い取るでしょう。将来的にページを簡単に再構築できるように、ローカルデータベースにデータを格納する可能性があります。

+0

http://www.shaolin.org/video-clips-3/sabah2007/sabah01.html は例です。あなたのアイデアはこれでうまくいくと思いますか? –

1

多すぎない場合は、テンプレートを作成してwysiwygエディタを使用してコンテンツをコピーして貼り付けることができます。

しかし、あなたはそれをprogramaticalyする必要がある場合、私はコンテンツを抽出するためにHTMLを解析することをお勧めします。 またはそれを掃除する、あなたがそれにアクセスできる場合は、私は同様のタスクのために使用したExpression Webを使用することができます、あなたはHTMLをきれいにして、ヘッダータグ、段落などを残して、それはあなたが望むデザインにあります。

ただし、手動で行うよりも、コードを書くほうが時間がかかることがあります。 何も手で行うよりも速いものはありません。このような古い、多くの場合、生成されたコードに直面したとき

幸運

+0

ページがたくさんあります。私がやっている1つの例は38ページです。しかしそれはただ一つです。おそらくそれらの20-30があります。 –

0

、私は検索の方に傾くと私のテキストエディタで交換する傾向があります。

ひどいですね。

しかし、真剣に、複数のファイルや正規表現の検索をサポートする強力なエディタを使用すると、大雑把なコードを削除することができます。それは最も簡単なことを言うには完璧な科学ではなく、「便利な」形式にするためには手動で操作する必要があるかもしれませんが、クリーンアップ作業の大部分を取り除きます。

関連する問題