从文本中剥离HTML的JavaScript

var bodyContent = document.getElementsByTagName('body')[0];
var result = appendTextNodes(bodyContent);

function appendTextNodes(element) {
    var text = '';

    // Loop through the childNodes of the passed in element
    for (var i = 0, len = element.childNodes.length; i < len; i++) {
        // Get a reference to the current child
        var node = element.childNodes[i];
        // Append the node's value if it's a text node
        if (node.nodeType == 3) {
            text += node.nodeValue;
        }
        // Recurse through the node's children, if there are any
        if (node.childNodes.length > 0) {
            appendTextNodes(node);
        }
    }
    // Return the final result
    return text;
}

7

0

添加问题

岚，巗峃，。

全部

技术

文化/娱乐

生活/艺术

科学

专业的

业务

用户

全部

新的

热门

1

2

3

4

5

您有问题吗？将问题添加到网站上并立即得到答复

zh.kzen.dev

Shog9 · Accepted Answer · 2009-05-04T22:48:21+00:00

如果你在浏览器中运行，那么最简单的方法就是[让浏览器为你做这件事......](

)

function stripHtml(html)
{
   var tmp = document.createElement("DIV");
   tmp.innerHTML = html;
   return tmp.textContent || tmp.innerText || "";
}

注意：正如人们在评论中指出的那样，如果你不能控制HTML的来源，最好不要这样做（例如，不要在任何可能来自用户输入的东西上运行这个程序）。对于这些情况，你仍然可以*让浏览器为你做这些工作--见Saba关于使用现在广泛使用的DOMParser的回答。