Парсинг без замен практически не возможен. В Датакол замены могут много и даже больше. Мало кто заглядывает в справку и смотрит возможности )) Часть спрашивают как сделать перенос, как пробел добавить. Все очень просто. Вот список стандартных так сказать макросов, на которые можно заменять
%NL% : перенос строки
%SPACE% : пробел
%TAB% : табуляция
Что еще можно?
Почти все) Тут на помощь нам приходят регулярные выражения (regexp). Для новичков обязательно ознакомиться с теорией!
^.*?$ - удаляет все от начала строки до конца или заменит на ваше значение
Следующие 2 замены оставят только ссылка на изображение или ее относительный путь:
1 - <img[^<>]*?src=['"]
2- ['"][^<>]*?>
Т.е если было <img src="/image/image1.jpg"> то останется /image/image1.jpg
В таком случае если в 1 замене сделать замену на http://domain.ru то получим полный путь к картинке. Аналогично можно делать с тегом <a>, только так href вместо src.
Очень полезная вещь это группы в регулярных выражениях, если в вкратце - то все что в первых скобках - это 1 группа, во 2х - вторая и т.д. Например, вы получили строку"2017/02/16" нужно поменять местами (от даты к году) и сделать разделитель точку:
([\d]{4})/([\d]{2})/([\d]{2}) меняем на $3.$2.$1
Получаем 16.02.2017
Продолжение следует ...
Спасибо вам, сейчас ваши статьи очень помогают в работе!
Пожалуйста. Я бы тоже хотел бы видеть такие статьи, когда только начинал знакомиться с парсингом )