如何在正则表达式中匹配"直到这个字符序列的任何内容"？

Question

更多

callum

问题

如何在正则表达式中匹配"直到这个字符序列的任何内容"？

以这个正则表达式为例：/^[^abc]/。这将匹配一个字符串开头的任何单个字符，除了a、b或c。

如果你在它后面加上一个*--/^[^abc]*/--正则表达式将继续在结果中加入每个后续字符，直到它遇到a，或b，**或c。

例如，对于源字符串""qwerty qwerty whatever abc hello""，该表达式将匹配到""qwerty qwerty wh""。

但是，如果我想让匹配的字符串是"qwerty qwerty whatever "呢？

...换句话说，我怎样才能匹配到（但不包括）准确的序列 "abc"的所有内容？

编程

regex

解决方案/答案

Jared Ng

19日八月 2011 в 4:48

更多

如果你想捕捉一切，直到"abc"。

/^(.*?)abc/

解释一下。

()捕获括号内的表达式，以便使用$1、$2等访问。

^匹配行首

.*匹配任何东西，?非贪婪地（匹配所需的最小字符数）- [1]

[1] 需要这样做的原因是，否则，在以下字符串中。

whatever whatever something abc something abc

默认情况下，词组是贪婪的，这意味着它将尽可能多地匹配。因此`/^.abc/将匹配"无论什么东西abc什么东西"。添加非贪婪的量词?`使得该词条只匹配"无论什么东西"。

108

0

Dadan

30日十一月 2016 в 8:17

更多

对于 Java 中的 regex，我相信在大多数 regex 引擎中也是如此，如果你想包含最后一部分，这就可以了。

.+?(abc)

例如，在这一行。

I have this very nice senabctence

选择所有字符，直到"abc&quot。并包括abc。

使用我们的regex，结果将是。 "我有这个很好的senabc

测试一下。 https://regex101.com/r/mX51ru/1

3

0

Software Mechanic

19日八月 2011 в 4:52

更多

我相信你需要子表达式。如果我没记错的话，你可以使用普通的()括号来表达子表达式。

这部分内容来自grep手册。

 Back References and Subexpressions
       The back-reference \n, where n is a single digit, matches the substring
       previously matched  by  the  nth  parenthesized  subexpression  of  the
       regular expression.

做一些类似于^[^(abc)]的事情应该会有效果。

kenorb

编辑本段答案21日十二月 2015 в 9:10

0

Balakrishna Gondesi

28日十月 2016 в 12:51

更多

试试这个

.+?efg

查询:

select REGEXP_REPLACE ('abcdefghijklmn','.+?efg', '') FROM dual;

产出 :

hijklmn

Mohammad

编辑本段答案28日十月 2016 в 7:42

-4

0

添加问题

岚，巗峃，。

全部

技术

文化/娱乐

生活/艺术

科学

专业的

业务

用户

全部

新的

它是如何工作的

.+?部分是.+的非贪婪版本（其中的一个或多个任何东西）。) 当我们使用.+时，引擎基本上会匹配所有的东西。然后，如果在regex中还有其他的东西，它就会分步返回到试图匹配下面的部分。这就是贪婪行为。意思是尽可能多的满足。

当使用.+?时，不需要一次全部匹配，而是回过头来寻找其他条件（如果有的话），引擎将通过以下方式匹配下一个字符。步骤，直到 regex 的后续部分被匹配（如果有的话）。这就是un-greedy，意思是匹配尽可能少的部分到满足。

<！--语言。 lang-none -->

/.+X/  ~ "abcXabcXabcX"        /.+/  ~ "abcXabcXabcX"
          ^^^^^^^^^^^^                  ^^^^^^^^^^^^

/.+?X/ ~ "abcXabcXabcX"        /.+?/ ~ "abcXabcXabcX"
          ^^^^                          ^

继而我们有(?={内容})，一个宽度为零的人。断言，一_围观。这种分组结构与它的内容，但不计入匹配的字符（零宽度）。它只返回是否匹配(assertion)。

因此，换句话说，regex /.+?(?=abc)/的意思是。

尽可能少地匹配任何字符，直到找到一个"abc" 被找到。不算"abc"。