renovations

This commit is contained in:
Ilya Kantor 2015-03-22 00:36:11 +03:00
parent c108f03596
commit 9122b131d0
12 changed files with 580 additions and 52 deletions

View file

@ -1,9 +1,13 @@
# Обратные ссылки \\n и $n
# Обратные ссылки: \n и $n
Скобочные группы можно не только получать в результате.
На скобочные группы можно ссылаться как в самом паттерне, так и в строке замены.
[cut]
Ссылки в строке замены мы уже видели: они имеют вид `$n`, где `n` -- это номер скобочной группы. Вместо `$n` подставляется содержимое соответствующей скобки:
## Группа в замене
Ссылки в строке замены имеют вид `$n`, где `n` -- это номер скобочной группы. Вместо `$n` подставляется содержимое соответствующей скобки:
```js
//+ run
@ -13,19 +17,26 @@ name = name.replace(/([а-яё]+) ([а-яё]+)/i, "$2, $1");
alert( name ); // Пушкин, Александр
```
К скобочной группе можно также обратиться в самом шаблоне.
## Группа в шаблоне
Рассмотрим это в реальном примере -- необходимо найти строку в кавычках. Эта строка может быть в одинарных кавычках <code class="subject">'...'</code> или в двойных <code class="subject">"..."</code> -- не важно, в каких именно, но открывающая и закрывающая кавычки должны быть одинаковыми.
Выше был пример использования содержимого групп в строке замены. Это удобно, когда нужно реорганизовать содержимое или создать новое с использованием старого.
Как такие строки искать? Регэксп <code class="pattern">`['"](.*?)['"]`</code> позволяет использовать разные кавычки, но он даст неверный ответ в случае, если одна кавычка ненароком оказалась внутри другой, как например в строке <code class="subject">"She's the one"</code>:
Но к скобочной группе можно также обратиться в самом поисковом шаблоне, ссылкой вида `\номер`.
Чтобы было яснее, рассмотрим это на реальной задаче -- необходимо найти в тексте строку в кавычках. Причём кавычки могут быть одинарными <code class="subject">'...'</code> или двойными <code class="subject">"..."</code> -- и то и другое должно искаться корректно.
Как такие строки искать?
Можно в регэкспе предусмотреть произвольные кавычки: <code class="pattern">`['"](.*?)['"]`</code>. Такой регэксп найдёт строки вида <code class="match">"..."</code>, <code class="match">'...'</code>, но он даст неверный ответ в случае, если одна кавычка ненароком оказалась внутри другой, как например в строке <code class="subject">"She's the one"</code>:
```js
//+ run
str = "He said:\"She's the one\"."
str = "He said:\"She's the one\".";
reg = /['"](.*?)['"]/g
reg = /['"](.*?)['"]/g;
alert(str.match(reg)) // "She'
// Результат не соответствует замыслу
alert( str.match(reg) ); // "She'
```
Как видно, регэксп нашёл открывающую кавычку <code class="match">"</code>, затем текст, вплоть до новой кавычки <code class="match">'</code>, которая закрывает соответствие.
@ -34,11 +45,11 @@ alert(str.match(reg)) // "She'
```js
//+ run
str = "He said:\"She's the one\"."
str = "He said:\"She's the one\".";
reg = /(['"])(.*?)\1/g
reg = /(['"])(.*?)\1/g;
alert(str.match(reg)) // "She's the one"
alert( str.match(reg) ); // "She's the one"
```
Теперь работает верно!
@ -46,7 +57,7 @@ alert(str.match(reg)) // "She's the one"
Обратим внимание на два нюанса:
<ul>
<li>В строке замены ссылка на первую скобочную группу выглядит как `$1`, а в шаблоне нужно использовать `\1`.</li>
<li>Чтобы обращаться к скобочной группе -- не важно откуда, она не должна быть исключена из запоминаемых при помощи `?:`, то есть `(?:['"])` не подошло бы.</li>
<li>Чтобы использовать скобочную группу в строке замены -- нужно использовать ссылку вида `$1`, а в шаблоне -- обратный слэш: `\1`.</li>
<li>Чтобы в принципе иметь возможность обратиться к скобочной группе -- не важно откуда, она не должна быть исключена из запоминаемых при помощи `?:`. Скобочные группы вида `(?:...)` не участвуют в нумерации.</li>
</ul>