2009-06-19 15 views

答えて

3

レンダリングされた文字サイズか? ユーザは、ブラウザの設定を使用して自由にテキストサイズを変更することができます。 異なるブラウザでも同じコンテンツが若干異なって表示されることは言うまでもありません。

+0

どこかに設定されていない限り、ブラウザのデフォルトサイズが使用されます。そして、通常、フォントは常にCSSで少なくとも1回は設定されます。 HTML自体のインラインCSSで上書きされない限り、クローラはおそらくDOM階層を調べて、どのCSS設定が使用されているか把握する必要があります。かなり多くの仕事が可能ですが、可能です。おそらく、ヘッダーを通常のテキストから切り離して、何が何であるかをよりよく理解するのは簡単でしょう。 – Alec

+0

私は同意すると、レンダリングされたテキストの実際のサイズを取得するために、すべてのhtml/css/jsを解析することによって、サーバー上のDOMをかなり複製する必要があります。気楽なプロジェクトのように聞こえる。 –

+0

間違いなくプロジェクトです。 IEピクセルの高さについて知りたい場合はさらに悪いことです。 gecko(または最近のFirefoxで使用されているもの)とWebkitで十分であれば、それほど悪くはありません。私の思考は、サーバーサイドの実行では扱いにくいようです。 –

0

あなたは答えは(思わ)「デフォルト」、この目的のためのないカスタマイズビューのためであることに満足している場合、私はあなたがかなり痛みを伴うシナリオを見ていると信じて:

  • 埋め込みあなたのスパイダーでCSS をサポートするレンダリングエンジン。多くのユーザーの と一致するエンジンを に使用するか、 の3つの共通エンジンをすべて使用し、すべての情報を に保存します。 埋め込みの容易さは、あなたの消費技術である で大きく異なります。

  • レンダリングエンジンでspideredされるURIをロードします。エンジンのAPIを使用して

  • 、それはあなたが 代表文章を考えるもの含む要素 ため フォントメトリックスをのクエリ(これを選択すると 私も 戦略を予測することは開始されませんそのための練習です)。どのように にアクセスするかは、 エンジンの埋め込みシナリオ全体に依存します( )。

私は、これは「ハードな方法」で期待するが、私は「簡単」な方法があるかわかりません。

関連する問題