比較的単純なプレーンのJavaScript、および非正規表現、アプローチ:
var htmlString = '<head><title>Some title</title></head><body><p>Some text, in a paragraph!</p></body>',
html = document.createElement('html'),
frag = document.createDocumentFragment();
html.innerHTML = htmlString;
frag.appendChild(html);
var titleText = frag.firstChild.getElementsByTagName('title')[0].textContent || frag.firstChild.getElementsByTagName('title')[0].innerText;
console.log(titleText);
JS Fiddle demo はここで完全なコードです。
私は明らかに、あなたのHTML文字列を推測して、コンテンツの周りから<html>
/</html>
タグを取り除いていました(明らかに存在する)。しかし、たとえそれらのタグが文字列内にあっても、それはまだ動作します:JS Fiddle demo。
そして、もう少し機能的なアプローチ:
function textFromHTMLString(html, target) {
if (!html || !target) {
return false;
}
else {
var fragment = document.createDocumentFragment(),
container = document.createElement('div');
container.innerHTML = html;
fragment.appendChild(container);
var targets = fragment.firstChild.getElementsByTagName(target),
result = [];
for (var i = 0, len = targets.length; i<len; i++) {
result.push(targets[i].textContent || targets[i].innerText);
}
return result;
}
}
var htmlString = '<html><head><title>Some title</title></head><body><p>Some text, in a paragraph!</p></body></html>';
var titleText = textFromHTMLString(htmlString, 'title');
console.log(titleText);
JS Fiddle demo。
jqueryを使用してタイトルタグを選択してください... regexは使用しないでください。 – nhahtdh
文書内にない文字列の中にあります –
私はそれを認識していますが、HTML文字列を解析してそれを処理するソリューションを見ています。編集:見つかったhttp://stackoverflow.com/questions/704679/parse-html-string-with-jquery – nhahtdh