Примеры регулярных выражений для поиска и замены или просто для парсинга текста. Для своих проектов использую, если пригодится и вам — пожалуйста.
Найти: >\s*<
Заменить на: >< |
Удалить пустоты между тэгами в HTML | |
<a .*href=».*?».*?> | Определение ссылок на странице | |
<[\w].*?><span\ itemprop=(‘|»)title(‘|»)> | ||
<h1\ .*?=(‘|»)title(‘|») .*?> | Найти H1 у которого class или id = title | |
<h1\ .*?=(‘|»)title(‘|») .*?>(.*?)</h1> | Найти тот же H1 и выдрать значение , потом вставить его через $3, например через поиск замену. | $ — означает переменную, из искомой строки выдирается всё, что в скобках, наше значение третье по счёту, поэтому 3. |
.*?
<.*?> — все тэги <div class=».*?»> — ДИВ ы с любым наименованием класса |
пользуемся комбинацией, если это непонятное количество символов, см примеры | не сработает, если есть переносы строк, тогда используем [\W\w] вместо .*?
Очень тормозит, при большом количестве вводных данных. |