2011-06-21 11 views
0

ウェブページのウェブサイト名やページ名を取得する方法、または少なくとも推測の方法を知る方法は不思議でした。ウェブページのウェブサイト名とページタイトルを取得する方法

たとえば、この質問のWebページのWebサイト名はStack Overflowで、ページタイトルは「WebページのWebサイト名とページタイトルを取得する方法」です。

100%の精度(またはそれ以上)を得ることはできませんが、少なくともこれを試すことは可能です。プログラミング言語は無関係です。

+0

のためには、サーバー側から意味かユーザーとして? –

+0

サーバー側。 – dmitrig01

答えて

0

あなたはタイトルの間のすべてだPHPシンプルなDOMパーサ

preg_match("/<title>(.*)<\/title>/s", $a, $matches); 

ようなもので、別のサイトをスクレイピングしている場合。擬似的なウェブサイト名を抽出しようとするなら(タイトルにあると仮定して)、通常は " - "、 "::"、 " - "という区切り文字になる前に、最初の一連の文字を並べ替えることができます。 - "または他の変種。あなたは100のウェブサイトを見て、最も一般的なものを見つけたいと思うでしょう。

+0

これは、このWebページの "Webアプリケーション - WebページのWebサイト名とページタイトルを取得する方法 - Stack Overflow"を取得します。それは私が探しているものではありません - 私は2つのことを探しています: "ウェブページのウェブサイト名とページタイトルを取得する方法"と "スタックオーバーフロー" – dmitrig01

+1

あなたのためにそれを調整しました。 – Tallboy

+0

html処理にdomをよく使う – ajreal

0

ページをスクラップして、タグの内容をプルしてタイトルを取得できます。これを行うには、HTMLパーサーを使用する必要があります。

私はウェブサイトの名前を取得する方法を正確にはわかりません。 URLを使い、きれいにフォーマットできますか?あなたはTLDとサブドメインを外して最初の文字を大文字にすることができます。例:

stackoverflow.com -> Stackoverflow 
en.wikipedia.org -> Wikipedia 

これは明らかに完璧な解決策ではありませんが、使用する場合には十分です。

0

、サーバー側から言ったように、それはjavascriptのこのような方法で行うことができ、

タイトル

var title = document.title; 

ためとURL

var location = document.location.href; 
関連する問題