webspiders/crawlersの場合、の最初のレンダリングサイズは、HTML文書に表示されるフォントのレンダリングサイズで、はCSSを念頭に置きます。ウェブページ上のフォントのサイズを取得する方法は?
0
A
答えて
3
レンダリングされた文字サイズか? ユーザは、ブラウザの設定を使用して自由にテキストサイズを変更することができます。 異なるブラウザでも同じコンテンツが若干異なって表示されることは言うまでもありません。
0
あなたは答えは(思わ)「デフォルト」、この目的のためのないカスタマイズビューのためであることに満足している場合、私はあなたがかなり痛みを伴うシナリオを見ていると信じて:
埋め込みあなたのスパイダーでCSS をサポートするレンダリングエンジン。多くのユーザーの と一致するエンジンを に使用するか、 の3つの共通エンジンをすべて使用し、すべての情報を に保存します。 埋め込みの容易さは、あなたの消費技術である で大きく異なります。
レンダリングエンジンでspideredされるURIをロードします。エンジンのAPIを使用して
、それはあなたが 代表文章を考えるもの含む要素 ため フォントメトリックスをのクエリ(これを選択すると 私も 戦略を予測することは開始されませんそのための練習です)。どのように にアクセスするかは、 エンジンの埋め込みシナリオ全体に依存します( )。
私は、これは「ハードな方法」で期待するが、私は「簡単」な方法があるかわかりません。
関連する問題
- 1. Javaフォントのサイズを取得
- 2. フォントのサイズ範囲を取得する方法
- 3. ボタンでウェブページのフォント色を変更する方法は?
- 4. (私のウェブページ上の)フラッシュオブジェクトのリンクを取得するには
- 5. ResultSetのサイズを取得する方法
- 6. ウェブページ上のPythonをストリームする方法
- 7. Google WebフォントURLからフォント名を取得する方法URL
- 8. PDFからテキストのフォント名を取得する方法は?
- 9. セレンウェブドライブのウェブページにあるボタンの数を取得する方法
- 10. Appのサイズを取得する方法+ Appのデータのサイズ
- 11. ルートのサイズを取得する方法&&ルートの使用サイズ
- 12. 外部ウェブページのスクリーンショットイメージを取得する最速の方法
- 13. PDFからPython3のフォントとフォントの情報を取得する方法
- 14. クロムリモートデバッグを使用してウェブページのリソースコンテンツを取得する方法
- 15. CGContextShowGlyphsAtPointでテキストを描画する - フォントの寸法を取得する方法は?
- 16. ウェブページのウェブサイト名とページタイトルを取得する方法
- 17. ウェブページのテーブルからデータを取得する方法
- 18. ウェブページのコンテンツを取得するには
- 19. ウェブページのURLを取得するには
- 20. pdfboxを使用してフォントの色を取得する方法
- 21. リモートサーバー上のファイルのサイズを取得
- 22. phpファイルでgujratiフォントを取得する方法は?
- 23. node.jsの画像ファイルのサイズを取得する方法は?
- 24. スプライト "シート"内のスプライトのサイズを取得する方法は?
- 25. マップ内のキーのサイズを取得する方法は?
- 26. ブートストラップの現在の画面サイズを取得する方法は?
- 27. Linuxのプログラムでディレクトリのサイズを取得する方法は?
- 28. Outlookのメールアイテムのサイズを取得する方法は?
- 29. .Net Coreのttfファイルからフォント名を取得する方法
- 30. フォントの色を取得する方法は、CSSで値するのですか?
どこかに設定されていない限り、ブラウザのデフォルトサイズが使用されます。そして、通常、フォントは常にCSSで少なくとも1回は設定されます。 HTML自体のインラインCSSで上書きされない限り、クローラはおそらくDOM階層を調べて、どのCSS設定が使用されているか把握する必要があります。かなり多くの仕事が可能ですが、可能です。おそらく、ヘッダーを通常のテキストから切り離して、何が何であるかをよりよく理解するのは簡単でしょう。 – Alec
私は同意すると、レンダリングされたテキストの実際のサイズを取得するために、すべてのhtml/css/jsを解析することによって、サーバー上のDOMをかなり複製する必要があります。気楽なプロジェクトのように聞こえる。 –
間違いなくプロジェクトです。 IEピクセルの高さについて知りたい場合はさらに悪いことです。 gecko(または最近のFirefoxで使用されているもの)とWebkitで十分であれば、それほど悪くはありません。私の思考は、サーバーサイドの実行では扱いにくいようです。 –