Búsqueda y eliminación de caracteres no ascii de un Varchar2 de Oracle

Question

Más

Question

Búsqueda y eliminación de caracteres no ascii de un Varchar2 de Oracle

Actualmente estamos migrando una de nuestras bases de datos oracle a UTF8 y hemos encontrado algunos registros que están cerca del límite varchar de 4000 bytes. Cuando intentamos migrar estos registros fallan ya que contienen caracteres que se convierten en caracteres UF8 multibyte. Lo que quiero hacer con PL/SQL es localizar estos caracteres para ver cuáles son y luego cambiarlos o eliminarlos.

Me gustaría hacer:

SELECT REGEXP_REPLACE(COLUMN,'[^[:ascii:]],'')

pero Oracle no implementa la clase de caracteres [:ascii:].

¿Hay alguna forma sencilla de hacer lo que quiero?

FerranB

Pregunta editada 12º febrero 2010 в 10:23

Programación

regex

oracle

ascii

Solution / Answer

Gary Myers

10º febrero 2010 в 10:29

Más

Tuve un problema similar y lo publiqué en mi blog aquí. Empecé con la expresión regular para números alfa y luego añadí los pocos caracteres de puntuación básicos que me gustaban:

select dump(a,1016), a, b
from
 (select regexp_replace(COLUMN,'[[:alnum:]/''%()> -.:=;[]','') a,
         COLUMN b
  from TABLE)
where a is not null
order by a;

Utilicé dump con la variante 1016 para obtener los caracteres hexadecimales que quería reemplazar y que luego pude utilizar en un utl_raw.cast_to_varchar2.

2

0

Añadir pregunta

Categorías

Todo

Tecnología

Cultura / Recreación

Vida / Artes

Ciencia

Profesional

Negocios

Usuarios

Todo

Nuevo

Popular

1

Ксения Комарова

Registrado hace 1 mes

2

Артур «Апер»

Registrado hace 2 meses

3

Viktor Malyutin

Registrado hace 2 meses

4

Viktor Malyutin

Registrado hace 2 meses

5

Syahputra Zhedenk

Registrado hace 3 meses

¿Tiene alguna pregunta? Añádela en el sitio y obtén una respuesta al instante

es.kzen.dev

Max Shawabkeh · Accepted Answer · 2010-02-10T11:44:21+00:00

En una codificación compatible con ASCII de byte único (por ejemplo, Latin-1), los caracteres ASCII son simplemente bytes en el rango de 0 a 127. Por tanto, puede utilizar algo como [\x80-\xFF] para detectar caracteres no ASCII. Así que puedes usar algo como [\x80-\xFF] para detectar caracteres no ASCII.