К сожалению этот метод уже не работает. Сам недавно делал и не вышло. Не возможно отметить в браузере Датакол галочку, что я не робот.
Наверное одной из самых проблематичных и распространенных капч на данный момент является ReCaptcha от Google второй версии. Для ее распознавания нужно выбрать фрагменты картинок по смыслу.
Датакол пока не автоматизировал этот процесс, хотя дискуссии идут давно и обещают все-таки сделать это. Если мы зайдем в редактор сценария, то можно увидеть, что предпосылки есть
!!! Не делайте это для рабочих проектов. Сейчас при попытке настроить вы получите XML ошибку в проекте и он больше не будет работать!!!
Как сделать ручное распознавание рекапчи в Datacol?
- Нам нужен режим браузера и включаем выполнение сценаря
- Переходим в редактор сценария, содаем новый блок, назовем его reCaptcha
- Добавим 3 действия, с настройками по умолчанию: WAIT - USER_INPUT - WAIT
- Добавим одно условие выполнения WEB_ELEMENT_EXIST с xpath //div[@class="captcha-container"]
Теперь, при появлении капчи на странице, сработает USER_INPUT, т.е прервется выполнение парсинга и вы сможете в окне браузера выполнить действия для рекапчи, далее нужно будет нажать кнопку продолжения работы.
Привет! Вопрос немного в другой теме, однако крайне подобной - присутствует ли методика обхода DDoS protection by Cloudflare? Пробовал разные варианты с подстановкой кукисов (__cfduid и cf_clearance), но ничего не получается. Буду крайне признателен за подсказку, если таковое решение присутствует.
Добрый день. К сожалению не приходилось решать такую защиту, поэтому не
подскажу.
Нашел решение - в режиме браузера через настройку сценария (ожидание в сек или до появления элемента сайта), правда оно не оптимальное. Страдает скорость выходит что в минуту можно таким образом только 10-12 страниц обработать, а также некоторые значения Datacol со страницы не вытягивает.
Что-то это не сработало(
К сожалению этот метод уже не работает. Сам недавно делал и не вышло. Не возможно отметить в браузере Датакол галочку, что я не робот.
Меняйте на
//div[@id="grecaptcha"]
если стоит recapcha
И тогда сценарий сработает.