fixes, renovations
This commit is contained in:
parent
3889056599
commit
bc34b2fc9d
133 changed files with 189 additions and 10 deletions
|
@ -0,0 +1,21 @@
|
|||
|
||||
Открывающий тег -- это <code class="pattern">\[(b|url|quote)\]</code>.
|
||||
|
||||
Для того, чтобы найти всё до закрывающего -- используем ленивый поиск <code class="pattern">[\s\S]*?</code> и обратную ссылку на открывающий тег.
|
||||
|
||||
Итого, получится: <code class="pattern">\[(b|url|quote)\][\s\S]*?\[/\1\]</code>.
|
||||
|
||||
В действии:
|
||||
|
||||
```js
|
||||
//+ run
|
||||
var re = /\[(b|url|quote)\][\s\S]*?\[\/\1\]/g;
|
||||
|
||||
var str1 = "..[url]http://ya.ru[/url]..";
|
||||
var str2 = "..[url][b]http://ya.ru[/b][/url]..";
|
||||
|
||||
alert( str1.match(re) ); // [url]http://ya.ru[/url]
|
||||
alert( str2.match(re) ); // [url][b]http://ya.ru[/b][/url]
|
||||
```
|
||||
|
||||
Для закрывающего тега `[/1]` понадобилось дополнительно экранировать слеш: `\[\/1\]`.
|
|
@ -0,0 +1,41 @@
|
|||
# Найдите пары тегов
|
||||
|
||||
ББ-тег имеет вид `[имя]...[/имя]`, где имя -- слово, одно из: `b`, `url`, `quote`.
|
||||
|
||||
Например:
|
||||
```
|
||||
[b]текст[/b]
|
||||
[url]http://ya.ru[/url]
|
||||
```
|
||||
|
||||
ББ-теги могут быть вложенными, но сам в себя тег быть вложен не может, например:
|
||||
|
||||
```
|
||||
Допустимо:
|
||||
[url] [b]http://ya.ru[/b] [/url]
|
||||
[quote] [b]текст[/b] [/quote]
|
||||
|
||||
Нельзя:
|
||||
[b][b]текст[/b][/b]
|
||||
```
|
||||
|
||||
Создайте регулярное выражение для поиска ББ-тегов и их содержимого.
|
||||
|
||||
Например:
|
||||
|
||||
```js
|
||||
var re = /* регулярка */
|
||||
|
||||
var str = "..[url]http://ya.ru[/url]..";
|
||||
alert( str.match(re) ); // [url]http://ya.ru[/url]
|
||||
```
|
||||
|
||||
Если теги вложены, то нужно искать самый внешний тег (при желании можно будет продолжить поиск в его содержимом):
|
||||
|
||||
```js
|
||||
var re = /* регулярка */
|
||||
|
||||
var str = "..[url][b]http://ya.ru[/b][/url]..";
|
||||
alert( str.match(re) ); // [url][b]http://ya.ru[/b][/url]
|
||||
```
|
||||
|
|
@ -0,0 +1,67 @@
|
|||
# Обратные ссылки: \n и $n
|
||||
|
||||
Скобочные группы можно не только получать в результате.
|
||||
|
||||
На скобочные группы можно ссылаться как в самом паттерне, так и в строке замены.
|
||||
[cut]
|
||||
|
||||
## Группа в строке замены
|
||||
|
||||
Ссылки в строке замены имеют вид `$n`, где `n` -- это номер скобочной группы.
|
||||
|
||||
Вместо `$n` подставляется содержимое соответствующей скобки:
|
||||
|
||||
```js
|
||||
//+ run
|
||||
var name = "Александр Пушкин";
|
||||
|
||||
name = name.replace(/([а-яё]+) ([а-яё]+)/i, *!*"$2, $1"*/!*);
|
||||
alert( name ); // Пушкин, Александр
|
||||
```
|
||||
|
||||
В примере выше вместо <code class="pattern">$2</code> подставляется второе найденное слово, а вместо <code class="pattern">$1</code> -- первое.
|
||||
|
||||
## Группа в шаблоне
|
||||
|
||||
Выше был пример использования содержимого групп в строке замены. Это удобно, когда нужно реорганизовать содержимое или создать новое с использованием старого.
|
||||
|
||||
Но к скобочной группе можно также обратиться в самом поисковом шаблоне, ссылкой вида `\номер`.
|
||||
|
||||
Чтобы было яснее, рассмотрим это на реальной задаче -- необходимо найти в тексте строку в кавычках. Причём кавычки могут быть одинарными <code class="subject">'...'</code> или двойными <code class="subject">"..."</code> -- и то и другое должно искаться корректно.
|
||||
|
||||
Как такие строки искать?
|
||||
|
||||
Можно в регэкспе предусмотреть произвольные кавычки: <code class="pattern">`['"](.*?)['"]`</code>. Такой регэксп найдёт строки вида <code class="match">"..."</code>, <code class="match">'...'</code>, но он даст неверный ответ в случае, если одна кавычка ненароком оказалась внутри другой, как например в строке <code class="subject">"She's the one!"</code>:
|
||||
|
||||
```js
|
||||
//+ run
|
||||
str = "He said: \"She's the one!\".";
|
||||
|
||||
reg = /['"](.*?)['"]/g;
|
||||
|
||||
// Результат не соответствует замыслу
|
||||
alert( str.match(reg) ); // "She'
|
||||
```
|
||||
|
||||
Как видно, регэксп нашёл открывающую кавычку <code class="match">"</code>, затем текст, вплоть до новой кавычки <code class="match">'</code>, которая закрывает соответствие.
|
||||
|
||||
Для того, чтобы попросить регэксп искать закрывающую кавычку -- такую же, как открывающую, мы обернём её в скобочную группу и используем обратную ссылку на неё:
|
||||
|
||||
```js
|
||||
//+ run
|
||||
str = "He said: \"She's the one!\".";
|
||||
|
||||
reg = /(['"])(.*?)\1/g;
|
||||
|
||||
alert( str.match(reg) ); // "She's the one!"
|
||||
```
|
||||
|
||||
Теперь работает верно! Движок регулярных выражений, найдя первое скобочное выражение -- кавычку <code class="pattern">(['"])</code>, запоминает его и далее <code class="pattern">\1</code> означает "найти то же самое, что в первой скобочной группе".
|
||||
|
||||
Обратим внимание на два нюанса:
|
||||
|
||||
<ul>
|
||||
<li>Чтобы использовать скобочную группу в строке замены -- нужно использовать ссылку вида `$1`, а в шаблоне -- обратный слэш: `\1`.</li>
|
||||
<li>Чтобы в принципе иметь возможность обратиться к скобочной группе -- не важно откуда, она не должна быть исключена из запоминаемых при помощи `?:`. Скобочные группы вида `(?:...)` не участвуют в нумерации.</li>
|
||||
</ul>
|
||||
|
Loading…
Add table
Add a link
Reference in a new issue