Cómo mostrar código html sin formato en PRE o algo parecido pero sin escaparlo

Question

Más

Question

Cómo mostrar código html sin formato en PRE o algo parecido pero sin escaparlo

Me gustaría mostrar HTML sin formato. Todos sabemos que uno tiene que escapar cada "<" y ">" así

     <PRE> this is a test  &ltDIV&gt </PRE>

Sin embargo, yo no quiero hacer esto. Me gustaría una manera de mantener el código HTML como es (ya que es más fácil de leer, (dentro del editor) y yo podría querer copiarlo y utilizarlo de nuevo a mí mismo como código HTML real, y no quiero tener que cambiar de nuevo o tener 2 versiones del mismo código uno escapado y uno no escapado).

¿Hay algún otro entorno que sea más "crudo" que PRE que pueda permitir esto? ¿Para no tener que estar editando HTML y cambiándolo todo cada vez que se quiera mostrar código HTML en bruto, tal vez en HTML5?

Algo como <REALLY_VERBATIM> ...... </<REALLY_VERBATIM>.

captura de pantalla

La solución javascript no funciona en FF 21, aquí está la captura de pantalla introduzca aquí la descripción de la imagen

**Captura de pantalla 2

La primera solución todavía no funciona en Firefox, aquí está la captura de pantalla introduzca aquí la descripción de la imagen

Robert H

Pregunta editada 28º mayo 2013 в 5:53

Programación

html

pre

Solution / Answer

GitaarLAB

28º mayo 2013 в 6:04

Más

A LOS EDITORES: DEJE LOS NIVELES DE INDENTACIÓN POR FAVOR, SON IMPORTANTES --> Esencialmente la pregunta original se puede dividir en 2 partes:

Objetivo/desafío principal: incrustar(/transportar) un fragmento de código sin formato (cualquier tipo de código) en una página web's de marcado (para un simple copiar / pegar / editar debido a no codificación/escapado)
mostrar/renderizar correctamente ese fragmento de código (posiblemente editarlo) en el navegador La respuesta corta (pero) ambigua es: no puedes, ...pero puedes (acercarte mucho). (Lo sé, son 3 respuestas contradictorias, así que sigue leyendo...) (políglota)(x)(ht)ml Los lenguajes de marcado se basan en envolver (casi) todo entre etiquetas/secuencias de caracteres de inicio/apertura y de fin/cierre.
Por lo tanto, para incrustar cualquier tipo de código/snippet crudo dentro de su lenguaje de marcado, uno siempre tendrá que escapar/codificar cada instancia (dentro de ese snippet) que se parezca al carácter(-secuencia) que cerraría el elemento 'contenedor' de envoltura en el marcado. (Durante este post me referiré a esto como regla no 1.) Piense en "algunos "datos" aquí" o <i>..cerrar cursiva con '</i>'-tag</i>, donde es obvio que uno debería escapar/codificar (algo en) </i y " (o cambiar el carácter de cita del contenedor'de " a ').
Así que, debido a la regla nº 1, no se puede 'simplemente' incrustar 'cualquier' fragmento de código sin procesar desconocido dentro del marcado. Porque, si uno tiene que escapar/codificar incluso un carácter dentro del fragmento sin procesar, entonces ese fragmento ya no sería el mismo 'código sin procesar puro' original que cualquiera puede copiar/pegar/editar en el marcado del documento sin más reflexión. Llevaría a un marcado malformado/ilegal y Mojibake (principalmente) debido a las entidades.
Además, si ese fragmento contuviera tales caracteres, todavía necesitaría algún javascript para 'traducir' ese carácter(secuencia) desde (y hacia) su representación escapada/codificada para mostrar el fragmento correctamente en la 'página web' (para copiar/pegar/editar).
Esto nos lleva a (algunos de) los tipos de datos que especifican los lenguajes de marcado. Estos tipos de datos definen esencialmente lo que se consideran 'caracteres válidos' y su significado (por etiqueta, propiedad, etc.):
PCDATA (Parsed Character DATA): expandirá entidades y se debe escapar <, & (y > dependiendo del lenguaje/versión de marcado).
La mayoría de las etiquetas como body, div, pre, etc, pero también textarea (hasta HTML5) pertenecen a este tipo.
Así que no sólo tiene que codificar todas las secuencias de caracteres de cierre del contenedor dentro del fragmento, también tiene que codificar todos los caracteres <, & (,>) (como mínimo).
Huelga decir que codificar/escapar tantos caracteres queda fuera del ámbito de este objetivo de incrustar un fragmento sin formato en el marcado.
'..Pero un textarea parece funcionar...', sí, ya sea debido a los navegadores error-engine tratando de hacer algo fuera de él, o porque HTML5:
RCDATA (Replaceable Character DATA): no tratará las etiquetas dentro del texto como marcado (pero siguen rigiéndose por la regla 1), por lo que no es necesario codificar < (>). PERO las entidades siguen expandiéndose, por lo que y#39;ambiguos ambiguos' (&) requieren un cuidado especial.
La actual especificación HTML5 dice que el textarea es ahora un campo RCDATA y (cita):

El texto de los elementos raw text y RCDATA no debe contener ninguna apariciones de la cadena "</" (U+003C SIGNO MENOR, U+002F SOLIDUS) seguida de caracteres que coincidan de forma insensible a mayúsculas y minúsculas con el nombre de etiqueta de el elemento seguido de uno de los caracteres U+0009 CHARACTER TABULATION (tabulación), U+000A LINE FEED (LF), U+000C FORM FEED (FF), U+000D CARRIAGE RETURN (CR), U+0020 ESPACIO, U+003E SIGNO MAYOR (>), o U+002F SOLIDUS (/). Así que, pase lo que pase, textarea necesita un gestor de traducción de entidades o si no, ¡acabará Mojibake en las entidades!
CDATA (Character Data) no tratará las etiquetas dentro del texto como y no expandirá las entidades.
Así que mientras el código del fragmento en bruto no viole la regla 1 (que no se puede tener los contenedores cerrando carácter(secuencia) dentro del fragmento), esto no requiere ningún otro escape/codificación. Claramente esto se reduce a: cómo podemos minimizar el número de caracteres/secuencias de caracteres que todavía necesitan ser codificados en el snippet's raw source y el número de veces que ese carácter(secuencia) podría aparecer en un snippet promedio; algo que también es de importancia para el javascript que maneja la traducción de estos caracteres (si ocurren). Entonces, ¿qué 'contenedores' tienen este contexto CDATA?
La mayoría de las propiedades de valor de las etiquetas son CDATA, por lo que uno podría (ab)usar una propiedad de valor de entrada oculta ([prueba de concepto jsfiddle aquí][3]).
Sin embargo (conforme a la regla 1) esto crea un problema de codificación/escape con comillas anidadas (" y ') en el fragmento sin procesar y uno necesita algo de javascript para obtener/traducir y establecer el fragmento en otro elemento (visible) (o simplemente establecerlo como valor de un área de texto's). De alguna manera esto me dio problemas con las entidades en FF (al igual que en un textarea). Pero realmente no importa, ya que el 'precio' de tener que escapar/codificar las comillas anidadas es mayor que un textarea (HTML5) (las comillas son bastante comunes en el código fuente..). ¿Qué hay de tratar de (ab)usar <![CDATA[<tag>bla < bla</tag>]]>?
Como señala Jukka en su respuesta ampliada, esto sólo funcionaría en (raros) 'xhtml reales'.
Pensé en usar una etiqueta de guión (con o sin una envoltura CDATA dentro de la etiqueta de guión) junto con un comentario de varias líneas /* */ que envuelve el fragmento sin procesar (las etiquetas de guión pueden tener un id y se puede acceder a ellas por conteo). Pero como esto obviamente introduce un problema de escape con */, ]]> y </script en el fragmento sin procesar, esto tampoco parece una solución. Por favor, publica otros 'contenedores' viables en los comentarios a esta respuesta. Por cierto, codificar o contar el número de caracteres - y equilibrarlos dentro de una etiqueta de comentario  es una locura para este propósito (aparte de la regla 1).
Eso nos deja con [la excelente respuesta de Jukka K. Korpela'4]: **¡La etiqueta `

Jukka K. Korpela · Accepted Answer · 2013-05-28T07:17:37+00:00

Puede utilizar el elemento xmp, consulte https://stackoverflow.com/questions/4545/what-was-the-xmp-tag-used-for. Ha estado en HTML desde el principio y es soportado por todos los navegadores. Las especificaciones no lo ven con buenos ojos, pero HTML5 CR sigue describiéndolo y exige a los navegadores que lo soporten (aunque también indica a los autores que no lo usen, pero en realidad no puede impedírselo).

Todo lo que hay dentro de xmp se toma como tal, no se reconoce ningún marcado (etiquetas o referencias de caracteres) allí, excepto, por razón aparente, la etiqueta final del propio elemento, </xmp>.

Por lo demás, xmp se representa como pre.

Cuando se utiliza "XHTML real", es decir, XHTML servido con un tipo de medio XML (lo cual es poco frecuente), no se aplican las reglas especiales de análisis sintáctico, por lo que xmp se trata como pre. Pero en el "XHTML real", puede utilizar una sección CDATA, que implica reglas de análisis similares. No tiene un formato especial, por lo que probablemente querrá envolverla dentro de un elemento pre:

<pre><![CDATA[
This is a demo, tags like <p> will
appear literally.
]]></pre>

No veo cómo podrías combinar xmp y la sección CDATA para conseguir el llamado marcado políglota.