查找并删除 Oracle Varchar2 中的非 ascii 字符

Question

更多

问题

查找并删除 Oracle Varchar2 中的非 ascii 字符

我们目前正在将我们的一个 Oracle 数据库迁移到 UTF8，我们发现有几条记录接近 4000 字节的 varchar 限制。当我们尝试迁移这些记录时，由于其中包含的字符变成了多字节 UF8 字符，因此迁移失败。我想在 PL/SQL 中找到这些字符，看看它们是什么，然后更改或删除它们。

我想做的是：

SELECT REGEXP_REPLACE(COLUMN,'[^[:ascii:]],'')

但 Oracle 没有实现 [:ascii:] 字符类。

有什么简单的方法可以实现我想做的事情吗？

FerranB

已编辑的问题 12日二月 2010 в 10:23

编程

regex

oracle

ascii

解决方案/答案

Gary Myers

10日二月 2010 в 10:29

更多

我也遇到过类似的问题，并在博客这里中进行了讨论。我从字母数字的正则表达式开始，然后添加了几个我喜欢的基本标点符号：

select dump(a,1016), a, b
from
 (select regexp_replace(COLUMN,'[[:alnum:]/''%()> -.:=;[]','') a,
         COLUMN b
  from TABLE)
where a is not null
order by a;

我使用 1016 变体 dump 来给出我想替换的十六进制字符，然后在 utl_raw.cast_too_varchar2 中使用这些字符。

2

0

添加问题

岚，巗峃，。

全部

技术

文化/娱乐

生活/艺术

科学

专业的

业务

用户

全部

新的

热门

1

2

3

4

5

您有问题吗？将问题添加到网站上并立即得到答复

zh.kzen.dev

Max Shawabkeh · Accepted Answer · 2010-02-10T11:44:21+00:00

在单字节 ASCII 兼容编码（如 Latin-1）中，ASCII 字符只是 0 至 127 范围内的字节。因此，你可以使用类似"[\x80-\xFF]"的方法来检测非 ASCII 字符。