如何在 PRE 中显示原始 HTML 代码或类似代码，但不对其进行转义处理

Question

更多

问题

如何在 PRE 中显示原始 HTML 代码或类似代码，但不对其进行转义处理

我想显示原始 HTML。我们都知道，必须在每个 "<" 和 ">" 之间转义，就像这样

     <PRE> this is a test  &ltDIV&gt </PRE>

但是，我不想这样做。我希望有一种方法可以保持 HTML 代码的原样（因为它更容易阅读（在编辑器内），而且我可能想复制它并将其作为实际的 HTML 代码再次使用，而不想再次修改它或有两个版本的相同代码，一个转义，一个不转义）。

有没有其他比 PRE 更原始的环境允许这样做？这样人们就不必在每次要显示原始 HTML 代码（可能是 HTML5）时都要不停地编辑 HTML 并更改所有内容？

类似于 <REALLY_REALLY_VERBATIM> ...... </<REALLY_REALLY_VERBATIM> 这样。

屏幕截图

JavaScript 解决方案在 FF 21 上不起作用，以下是屏幕截图 ![此处输入图片描述][1］

屏幕截图 2

第一个解决方案仍然无法在 Firefox 上运行，以下是屏幕截图 ![此处输入图片描述][2］

Robert H

已编辑的问题 28日五月 2013 в 5:53

编程

html

pre

解决方案/答案

GitaarLAB

28日五月 2013 в 6:04

更多

致编辑：请不要使用标点符号，它们很重要 --&gt；从本质上讲，原始问题可以分为两个部分：

主要目标/挑战：在网页中嵌入（/传输）原始格式的代码片段（任何类型的代码 (任何类型的代码）嵌入（/传输）到网页的标记中（由于没有编码/转码）
在以下浏览器中正确显示/渲染该代码片段（可能进行编辑浏览器简短（但）模棱两可的回答是你不能，......但你可以（非常接近）。 (我知道，这是三个相互矛盾的答案，请继续阅读......） (polyglot)(x)(ht)ml 标记语言依赖于在开始/打开和结束/关闭标记/字符（序列）之间包装（几乎）所有内容。
因此，要想在标记语言中嵌入种原始代码/片段，就必须对（片段中的）每一个类似于字符（序列）的实例进行转义/编码，这些字符（序列）将关闭标记语言中的包装'容器'元素。 (在这篇文章中，我将把这称为规则 1）。试想一下 "some "data" here" 或 <i>...close italics with '</i>'-tag</i> ，很明显，我们应该在 </i 和 " 中转义/编码（或将 container'quote character 从 " 改为 '）。
因此，根据规则 1，你不能*'只是'在标记中嵌入'任何'未知的原始代码片段。因为，如果必须在原始代码段中转义/编码哪怕是一个字符，那么该代码段就不再是任何人都可以复制/粘贴/编辑到文档标记中的原始'纯粹的原始代码'。这将导致畸形/非法标记和 Mojibake（主要是）实体。
此外，如果片段包含此类字符，您仍需要一些 javascript 来将该字符（序列）从其转义/编码表示法（和转义/编码表示法）转换为'网页'（用于复制/粘贴/编辑）中正确*地显示该片段。
这就涉及到标记语言指定的（部分）数据类型。这些数据类型基本上定义了哪些字符被认为是'有效字符'及其含义（每个标签、属性等）：
PCDATA（解析字符数据）：将扩展实体，必须转义<、&（和>取决于标记语言/版本）。大多数标记，如body、div、pre等，以及textarea（直到 HTML5）都属于这种类型。因此，您不仅需要在代码段中对所有容器的结尾字符序列进行编码，还需要在代码段中对所有容器的结尾字符序列进行编码。还必须对所有<,&(,>`) 字符进行编码。 (至少）。
不用说，这么多字符的编码/转码超出了本在标记中嵌入原始代码段。
&#39；......但文本区似乎可以工作......&#39；，是的，要么是因为浏览器的错误引擎试图从中找出点什么，或者是因为 HTML5：
RCDATA（可替换字符数据）：不会不把文本内的标记视为标记（但仍然是标记）。文本中的标记不视为标记（但仍受规则 1 的约束），因此不需要对'进行编码。编码 < (>)。但实体仍被扩展，因此它们和 '模棱两可的 (&) 需要特别注意。
当前*的HTML5 规范称文本区现在是一个 RCDATA 字段和（引用）：生文本 "和 "RCDATA "元素中的文本不得包含任何出现字符串 "</" (U+003C LESS-THAN SIGN, U+002F SOLIDUS)

后跟的字符大小写不敏感地匹配该元素的标记名元素后跟 U+0009 字符制表符（制表符）之一、 U+000A 行馈（LF），U+000C 格式馈送（FF），U+000D 回车（CARRIAGE RETURN (CR)、U+0020 空格、U+003E 大号 (>) 或 U+002F 空格 (/)。因此，无论如何，文本区域都需要一个强大的实体翻译处理程序，否则它*终会对实体产生 Mojibake！
CDATA（字符数据）不会将文本内的标记视为标记，也不会扩展实体。标记，也不会扩展实体。
因此，只要原始代码片段不违反第 1 条规则（即不能有容器关闭字符（序列在代码段内有容器关闭字符（序列）），这就就不需要其他转义/编码。很明显，归结为：我们如何才能尽量减少仍需在片段原始源代码中编码的字符/字符序列的数量，以及该字符（序列）在普通片段中可能出现的次数；这对于处理这些字符（如果出现）翻译的 javascript 也很重要。那么，哪些'容器'具有这种 "CDATA "上下文呢？
标签的大多数值属性都是 CDATA，因此可以（滥用）使用隐藏输入的值属性（[此处的 jsfiddle 概念验证][3]）。
但是（符合规则 1），这会在原始代码段中产生嵌套引号（" 和 '）的编码/换码问题，因此需要使用一些 javascript 来获取/翻译代码段，并将其设置在另一个（可见）元素中（或简单地将其设置为文本区域的值）。不知为什么，这给我在 FF 中使用实体带来了问题（就像在文本区域中一样）。但这并不重要，因为必须转义/编码嵌套引号的代价比（HTML5）文本区域更高（引号在源代码中很常见......）。那么尝试（ab）使用 <![CDATA[<tag>bla&bla</tag>]]>如何？
正如 Jukka 在他的扩展答案中指出的，这只能在（罕见的）'真正的 xhtml' 中起作用。
我曾想过使用脚本标记（无论脚本标记内是否有 CDATA 封装）和多行注释"/ /"来封装原始代码段（脚本标记可以有一个 "id"，您可以通过计数来访问它们）。但是，由于这显然会给原始代码段中的/、]]>和</script` 带来转义问题，这似乎也不是一个解决方案。 请在本答案的评论中发表其他可行的'容器'。顺便说一下，在注释标记"<!---> "中编码或计算"-"字符的数量并使其平衡，对于这个目的来说简直是疯了（除了规则 1）。 <hr&gt；这样一来，我们就只能使用 Jukka K. Korpela'excellent answer：<xmp>标签似乎是最好的选择！* '被遗忘的' <xmp>标签包含 CDATA，就是为了这个目的而设计的，而且确实仍然[在当前的 HTML 5 规范中]5（至少从 HTML3.2 开始就是这样）；这正是我们所需要的！它还受到广泛支持，甚至在 IE6 中也是如此（也就是说......直到它出现与滚动表体相同的退步）。
注意：正如 Jukka 指出的那样，这在真正的 xhtml 或 polyglot 中将不起作用（它们会将其视为 pre），而且 xmp 标记仍必须遵守第 1 条规则。但这是唯一的规则。
请看下面的标记

<!-- ATTENTION: replace any occurrence of </xmp with </xmp -->
<xmp id="snippet-container">
<div>
    <div>this is an example div & holds an xmp tag:<br />
        <xmp> 
<html><head>  <!-- indentation col 0!! -->
    <title>My Title</title>
</head><body>
    <p>hello world !!</p>
</body></html>
        </xmp>  <!-- note this encoded/escaped tag -->
    </div>
    This line is also part of the snippet
</div>
</xmp>

上面的代码框展示了一个原始的标记，其中 <xmp id="snippet-container"> 包含一个（几乎原始的）代码片段（包含 div>div>xmp>html-document）。
注意到这个标记中编码的结束标记了吗？为了遵守第 1 条规则，这已被编码/转码）。
这样，嵌入/传输（有时几乎是）原始代码的问题就解决了。那么显示/渲染该代码段（以及编码后的"）呢？浏览器将（或应该）完全按照您在上述代码块中看到的方式显示片段（snippet-container内的内容）（不同浏览器对片段是否以空行开始存在一些差异）。这*包括*格式化/缩进、实体（如字符串"&）、完整标记、注释和编码后的结尾标记"`（就像在标记中编码一样）。根据浏览器（版本）的不同，甚至可以尝试使用属性 contenteditable="true" 来编辑该代码段（所有这些都不启用 javascript）。使用textarea.value=xmp.innerHTML之类的操作也是轻而易举的。 因此，您可以...如果片段不包含容器的结尾字符序列。 但是，如果原始代码段包含结尾字符序列"</xmp"（因为它是 xmp 本身的一个示例或包含一些 regex 等），您必须接受在原始代码段中对该序列进行编码/解码，并且需要一个 javascript 处理程序来转换该编码，以显示/渲染编码后的"&amp.lt;/xmp&gt"；lt;/xmp>，如内的textarea（用于编辑/张贴）或（例如）pre，以便正确呈现代码段'代码（似乎如此）。这里有一个非常简单的 [jsfiddle 示例][6]。请注意，即使在 IE6 中，获取/嵌入/显示/检索到文本区域也能完美运行。但是，设置xmp'innerHTML` 后，IE'发现了一些有趣的'智能'行为。在 fiddle 中有更详细的说明和解决方法。但现在是重要的关键（这也是你只能非常接近*的另一个原因）：举个过于简单的例子，想象一下这个兔子洞*：
原始代码片段：

<!-- remember to translate between </xmp> and </xmp> -->
<xmp>
<p>a paragraph</p>
</xmp>

那么，为了遵守第 1 条规则，我们只需要对这些 </xmp[> \n\rt\f\/] 序列进行编码，对吗？因此，我们可以得到下面的标记（仅使用一种可能的编码）：

<xmp id="container">
<!-- remember to translate between </xmp> and </xmp> -->
<xmp>
<p>a paragraph</p>
</xmp>
</xmp>

嗯......我该拿水晶球还是掷硬币？不，让计算机看一下它的系统时钟，然后说明得出的数字是随机的''。是的，应该这样做。使用类似*的 regex：xmp.innerHTML.replace(/<(?=//xmp[>\n\rt\f\/])/gi,'<');`,将翻译为'返回'：

<!-- remember to translate between </xmp> and </xmp> -->
<xmp>
<p>a paragraph</p>
</xmp>

嗯......看来这个随机生成器坏了...休斯顿......？
如果你错过了这个笑话/问题，请从 '原始代码片段'开始再读一遍。
等等，我知道，我们（还）需要将 .... 编码为 ....
好了，倒回去从'原代码片段'开始再读一遍。
不知怎的，这一切开始有了SO 上著名的搞笑但真实的 rexgex 答案的味道，对于精通 mojibake 的人来说，这是一本不错的读物。也许有人知道解决这个问题的巧妙算法或方案，但我认为内嵌的原始代码会变得越来越晦涩难懂，以至于你最好像其他人一样，只对 <、&（和 >）进行适当的转义/编码。 结论： （使用 xmp 标记）

可以使用不包含容器结尾字符序列的已知片段、
我们可以使用仅使用'基本一级'转义/编码的已知片段来实现最初的目标，这样我们就不会掉进兔子洞里、
但终似乎无法在'生产环境'中可靠地做到这一点，因为在生产环境中，人们可以/应该复制/粘贴/编辑'任何未知'原始片段，而不知道/理解其中的含义/规则/兔子洞（这取决于你对规则 1 和兔子洞的处理/翻译的实现）。

希望对您有所帮助！ PS：如果您觉得这个解释有用，我将感激不尽，但我认为 Jukka'答案应该是公认的答案（如果没有更好的选择/答案出现的话），因为是他记住了 xmp 标记（多年来我已经忘记了这个标记，并被 pre、textarea 等常用的 PCDATA 元素分散了注意力）。
本答案旨在解释为什么不能这样做（使用任何未知的原始片段），并解释其他一些答案（现已删除）在建议嵌入/传输文本区域时忽略的一些明显隐患。我扩展了现有的解释，也支持并进一步解释了 Jukka&#39 的答案（因为所有实体和 *CDATA 的东西几乎比代码页还难）。

Community

编辑本段答案23日五月 2017 в 12:34

22

0

PanicBus

17日十二月 2014 в 11:22

更多

如果启用了 jQuery，就可以使用 escapeXml 函数，而不必担心箭头或特殊字符的转义问题。

<pre>
  ${fn:escapeXml('
    <!-- all your code --> 
  ')};
</pre>

1

0

添加问题

岚，巗峃，。

全部

技术

文化/娱乐

生活/艺术

科学

专业的

业务

用户

全部

新的