2016-12-16 23 views
0

Google Apps ScriptのコンテンツからHTMLタグをストライピングする方法を探しています。Google Apps ScriptのストライプHTMLタグ

今の私は、HTMLの構文解析にこれらの機能を使用しています:

function getTextFromHtml(body) { 
    return getTextFromNode(Xml.parse(body, true).getElement()); 
} 

function getTextFromNode(x) { 
switch(x.toString()) { 
    case 'XmlText': return x.toXmlString(); 
    case 'XmlElement': return x.getNodes().map(getTextFromNode).join(''); 
    default: return ''; 
} 
} 

しかし、長いHTMLのこの方法は非常に非効率的であるため。

サンプルHTMLコンテンツ:http://pastebin.com/FmB4hvN2

任意のアイデア?

答えて

1

これは、すべてのタグを入力から削除します。

置き換えたいコンテンツが常に> <でラップされた場合
var text = html.replace(/<[^>]+>/g, ""); 
+0

を行うことができます!ありがとう! – Labradorcode

1

、あなたは正しいです

Regex rgx = new Regex(someString); 
string result = rgx.Replace("<[^>]*>", ""); 
関連する問題