Как мне написать регулярное выражение, которое исключает, а не сопоставляет, например, не (эта|строка)?

Я в тупике, пытаясь создать регулярное выражение Emacs, исключающее группы. [^] исключает отдельные символы в наборе, но я хочу исключить определенные последовательности символов: что-то вроде [^(not|this)], чтобы строки, содержащие "не" или "это", не совпадали.

В принципе, я мог бы написать ([^n][^o][^t]|[^...]), но есть ли другой способ, более чистый?

Anycorn 07.02.2010 источник

comment

@Гамбо. ты прав, спасибо - Anycorn 07.02.2010

comment

Щелкните тег regex-negation, чтобы просмотреть похожие вопросы. - finnw 09.02.2010

comment

Существует патч (не принятый) для предварительных утверждений, который делает это возможным: debbugs.gnu. org/db/53/5393.html - Matt Curtis 26.04.2019

Ответы (8)

arrow_upward
19
arrow_downward

Прежде всего: [^n][^o][^t] не является решением. Это также исключит такие слова, как nil ([^n] не соответствует), bob ([^o] не соответствует) или cat ([^t] не соответствует).

Но можно создать регулярное выражение с базовым синтаксисом, которое соответствует строкам, не содержащим ни not, ни this:

^([^nt]|n($|[^o]|o($|[^t]))|t($|[^h]|h($|[^i]|i($|[^s]))))*$

Шаблон этого регулярного выражения состоит в том, чтобы разрешить любой символ, который не является первым символом слов или только префиксами слов, но не целыми словами.

Gumbo 07.02.2010

comment

+1, и если бы у меня когда-нибудь возникло искушение переключиться на Emacs, это было бы достаточной причиной не делать этого. Как можно жить без прогнозов? :П - Alan Moore; 07.02.2010

comment

До сих пор мне очень нравился Emacs, это мое первое... - biocyberman; 03.08.2015

arrow_upward
30
arrow_downward

Это не просто возможно. Регулярные выражения предназначены для сопоставления вещей, и это все, на что они способны.

Прежде всего: [^] не обозначает «группу исключений», он обозначает отрицательный класс символов. Классы символов не поддерживают группировку в любой форме. Они поддерживают одиночные символы (и, для удобства, диапазоны символов). Ваша попытка [^(not|this)] на 100 % эквивалентна [^)(|hinots] в том, что касается механизма регулярных выражений.

Из этой ситуации могут выйти три пути:

сопоставить (not|this) и исключить любые совпадения с помощью среды, в которой вы находитесь (отменить результаты сопоставления)
используйте отрицательный прогноз, если он поддерживается вашим механизмом регулярных выражений и возможен в данной ситуации.
перепишите выражение, чтобы оно могло соответствовать: см. похожий вопрос, который я задавал ранее

Tomalak 07.02.2010

comment

Интересно, почему за этот ответ так мало голосов, это самый ясный ответ здесь! - Hi-Angel; 04.08.2014

comment

@Yagamy Потому что он более или менее говорит, что не работает, хотя явно есть способ заставить его работать (хотя и непрактичный, это скорее последнее средство). - Tomalak; 05.08.2014

comment

Я не вижу здесь утверждения «Не работает», даже наоборот: вы показали три способа, которые могут решить проблему, а третий точно такой же, как и принятый ответ. - Hi-Angel; 05.08.2014

comment

@Yagamy Верно, но магический трюк впечатляет гораздо больше, чем предостерегающий ответ. Это не умаляет принятого ответа, делать это таким образом - единственный вариант иногда, но в большинстве случаев это чертовски громоздко. Я упомянул этот вариант последним по причине. Думаю, людям больше нравятся ответы с вау-эффектом. :) - Tomalak; 05.08.2014

comment

это действительно отличный ответ, поскольку он помогает понять проблему таким образом, чтобы ее было легче решить. в emacs попробуйте M+X keep-lines удалить строки, которые не соответствуют тому, что вы хотите. - RubyTuesdayDONO; 17.06.2015

arrow_upward
14
arrow_downward

Трудно поверить, что принятый ответ (от Гамбо) действительно был принят! Если только оно не было принято, поскольку в нем указывалось, что вы не можете делать то, что хотите. Если у вас нет функции, которая генерирует такие регулярные выражения (как показывает Gumbo), их составление будет настоящей головной болью.

Каков реальный вариант использования - что вы действительно пытаетесь сделать?

Как указал Томалак, (а) это не то, что делают регулярные выражения; (b) см. другой пост, на который он ссылается, для хорошего объяснения, включая то, что делать с вашей проблемой.

Ответ заключается в том, чтобы использовать регулярное выражение для соответствия тому, что вам не нужно, а затем вычесть это из исходного домена. IOW, не пытайтесь заставить регулярное выражение выполнять исключение (это невозможно); выполните исключение after, используя регулярное выражение, чтобы соответствовать тому, что вы хотите исключить.

Так работает каждый инструмент, использующий регулярные выражения (например, grep): они предлагают отдельную опцию (например, через синтаксис), которая выполняет вычитание — после сопоставления того, что нужно вычесть.

Drew 21.08.2011

arrow_upward
10
arrow_downward

Похоже, вы пытаетесь сделать отрицательный прогноз. то есть вы пытаетесь прекратить сопоставление, как только достигнете некоторого разделителя.

Emacs не поддерживает просмотр вперед напрямую, но поддерживает нежадную версию *, + и ? операторы (*?, +?, ??), которые в большинстве случаев можно использовать с той же целью.

Так, например, чтобы соответствовать телу этой функции javascript:

bar = function (args) {
    if (blah) {
        foo();
    }
};

Вы можете использовать это регулярное выражение emacs:

function ([^)]+) {[[:ascii:]]+?};

Здесь мы останавливаемся, когда находим последовательность из двух элементов «};». [[:ascii:]] используется вместо "." оператор, потому что он работает с несколькими строками.

Это немного отличается от отрицательного просмотра вперед, потому что }; сама последовательность, с которой она совпала, однако, если ваша цель состоит в том, чтобы извлечь все до этого момента, вы просто используете группу захвата \( и \).

См. руководство по регулярным выражениям emacs: http://www.gnu.org/software/emacs/manual/html_node/emacs/Regexps.html

В качестве примечания: если вы пишете какое-либо регулярное выражение emacs, обязательно вызовите M-x re-builder, который вызовет небольшую IDE для написания вашего регулярного выражения для текущего буфера.

catphive 30.03.2013

arrow_upward
6
arrow_downward

Попробуйте M-x флеш-линии.

offby1 07.02.2010

arrow_upward
2
arrow_downward

В случае использования сопоставления строки для логического теста я делаю следующее:

;; Code to match string ends with '-region' but excludes those that has 'mouse'.
M-x ielm RET
*** Welcome to IELM ***  Type (describe-mode) for help.
ELISP> (setq str1 "mouse-drag-region" str2 "mou-drag-region" str3 "mou-region-drag")
"mou-region-drag"
ELISP> (and (string-match-p "-region$" str1) (not (string-match-p "mouse" str1)))
nil
ELISP> (and (string-match-p "-region$" str2) (not (string-match-p "mouse" str2))) 
t
ELISP> (and (string-match-p "-region$" str3) (not (string-match-p "mouse" str3)))
nil

Я использую этот подход, чтобы избежать ошибки функции, которую я обсуждал Здесь:

biocyberman 03.08.2015

arrow_upward
0
arrow_downward

Если вы пытаетесь использовать регулярное выражение для поиска или замены текста в буфере, вы можете использовать https://github.com/benma/visual-regexp-steroids.el/

Visual regexp steroids позволяет вам заменять, искать и т. д. с помощью python regex. Регулярное выражение Python поддерживает отрицательный взгляд вперед и отрицательный взгляд назад.

KhaflaniW 11.05.2020

comment

Добро пожаловать в stackoverflow.com. Пожалуйста, включите все ключевые детали в свой ответ. Как написано, ваш ответ будет иметь мало значения, если внешняя ссылка изменится. Дополнительные сведения см. в разделе Как ответить. - Simon.S.A.; 11.05.2020

arrow_upward
0
arrow_downward

Моя проблема заключалась в том, как передать отрицательное регулярное выражение в delete-lines, решение состояло в том, чтобы передать регулярное выражение M-x keep-lines

eweb 06.04.2021

Как мне написать регулярное выражение, которое исключает, а не сопоставляет, например, не (эта|строка)?

Ответы (8)

Вопросы по теме