en.javascript.info/10-regular-expressions-javascript/9-regexp-alternation/1-find-programming-language/solution.md
2015-04-07 15:22:06 +03:00

36 lines
1.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

Сначала неправильный способ.
Если перечислить языки один за другим через `|`, то получится совсем не то:
```js
//+ run
var reg = /Java|JavaScript|PHP|C|C\+\+/g;
var str = "Java, JavaScript, PHP, C, C++";
alert( str.match(reg) ); // Java,Java,PHP,C,C
```
Как видно, движок регулярных выражений ищет альтернации в порядке их перечисления. То есть, он сначала смотрит, есть ли <code class="match">Java</code>, а если нет -- ищет <code class="match">JavaScript</code>.
Естественно, при этом <code class="match">JavaScript</code> не будет найдено никогда.
То же самое -- с языками <code class="match">C</code> и <code class="match">C++</code>.
Есть два решения проблемы:
<ol>
<li>Поменять порядок, чтобы более длинное совпадение проверялось первым: <code class="pattern">JavaScript|Java|C\+\+|C|PHP</code>.</li>
<li>Соединить длинный вариант с коротким: <code class="pattern">Java(Script)?|C(\+\+)?|PHP</code>.</li>
</ol>
В действии:
```js
//+ run
var reg = /Java(Script)?|C(\+\+)?|PHP/g;
var str = "Java, JavaScript, PHP, C, C++";
alert( str.match(reg) ); // Java,JavaScript,PHP,C,C++
```