Регекс: Для извлечения подстроки между двумя тегами в строке

Question

Дополнительно

Вопрос

Регекс: Для извлечения подстроки между двумя тегами в строке

У меня есть файл в следующем формате:

Данные Данные
Данные
[Start].
Данные
[Конец]
Данные

Я'хотел бы взять Data I want между тегами [Start] и [End], используя Regex. Может ли кто-нибудь показать мне, как это можно сделать?

Aditi Parikh

Редактировал вопрос 14-го сентября 2017 в 7:01

Программирование

regex

parsing

Karl Seguin

4-го августа 2008 в 1:52

Дополнительно

\[start\](.*?)\[end\]

Zhich'll поместить текст в середине в пределах захвата.

YCF_L

Редактировал ответ 18-го сентября 2017 в 1:36

63

0

Решение / Ответ

PhaZe

6-го октября 2012 в 4:52

Дополнительно

$text ="Data Data Data start Data i want end Data";
($content) = $text =~ m/ start (.*) end /;
print $content;

У меня была подобная проблема некоторое время & я могу сказать Вам этот метод работы...

5

0

Jon Ericson

20-го августа 2008 в 7:14

Дополнительно

Более полное обсуждение ловушек использования regex, чтобы найти соответствие признакам может быть найдено в: < http://faq.perl.org/perlfaq4.html#How_do_I_find_matchi>. в частности, знайте, что гнездящимся признакам действительно нужен полноценный анализатор, чтобы интерпретироваться правильно.

Обратите внимание, что чувствительность к регистру должна будет быть выключена, чтобы ответить на вопрос, как указано. В жемчуге, that' s я модификатор:

$ echo "Data Data Data [Start] Data i want [End] Data" \
  | perl -ne '/\[start\](.*?)\[end\]/i; print "$1\n"'
 Data i want

Другая уловка должна использовать *? квантор, который выключает жадность захваченного матча. Например, если у Вас есть несоответствие [конец] признак:

Data Data [Start] Data i want [End] Data [end]

Вы, вероятно, don' t хотят захватить:

 Data i want [End] Data

4

0

un33k

11-го мая 2009 в 8:08

Дополнительно

Ну, если Вы гарантируете, что каждый признак начала сопровождается конечным тэгом тогда, следующее работало бы.

\[start\](.*?)\[end\]

Однако, Если у Вас есть сложный текст, такой как follwoing:

[start] sometext [start] sometext2 [end] sometext [end]

тогда Вы столкнулись бы с проблемами с regex.

Теперь следующий пример вытащит все горячие связи на странице:

'/<a(.*?)a>/i'

В вышеупомянутом случае мы можем гарантировать, что не было бы никаких вложенных случаев:

'<a></a>'

Так, это - сложный вопрос и can' t просто быть решенным с простым ответом.

3

0

Grant

4-го августа 2008 в 2:00

Дополнительно

В Perl вы можете окружить нужные вам данные символами ()'и вытащить их позже, возможно, в других языках есть подобная возможность.

if ($s_output =~ /(data data data data START(data data data)END (data data)/) 
{
    $dataAllOfIt = $1;      # 1 full string
    $dataInMiddle = $2;     # 2 Middle Data
    $dataAtEnd = $3;        # 3 End Data
}

brian d foy

Редактировал ответ 12-го октября 2008 в 12:21

1

0

N Murali Mohan

12-го сентября 2014 в 8:26

Дополнительно

Чтение текста с в квадратных скобках [] т.е. [Начало] и [Конец] и утверждает множество со списком ценностей. < b> jsfiddle

var mergeFields = ["[sitename]",
                   "[daystoholdquote]",
                   "[expires]",
                   "[firstname]",
                   "[lastname]",
                   "[sitephonenumber]",
                   "[hoh_firstname]",
                   "[hoh_lastname]"];       

var str = "fee [sitename] [firstname] \
sdfasd [lastname] ";
var res = validateMeargeFileds(str);
console.log(res);

function validateMeargeFileds(input) {
    var re = /\[\w+]/ig;
    var isValid;
    var myArray = input.match(re);

    try{
        if (myArray.length > 0) {
            myArray.forEach(function (field) {

                isValid = isMergeField(field);

                if (!isValid){
                   throw e;                        
                }
            });
        }
    }
    catch(e) {        
    }

    return isValid;
}

function isMergeField(mergefield) {
    return mergeFields.indexOf(mergefield.toLowerCase()) > -1;
}

Markus Safar

Редактировал ответ 7-го февраля 2016 в 12:38

0