Ранее я уже писал, как можно в ручном режиме решить рекапчу от Гугл в Датакол. Но вскоре встроенный браузер Datacol перестал с ней справляться и сделать клик стало невозможно.
Сейчас остался один способ решить рекапчу- использовать плагин Chrome. Но сразу говорю, что решать капчу Вы будете вручную.
Итак, для начала нужно выставить плагин Хрома в качестве загрузчика. Делается это на вкладке Загрузка-Базовые
Далее настраиваем плагин на одноименной вкладке. Выбираем плагин D5Plugin_Chrome.dll и прописываем в конфигурации следующие строки
<dc5par type="int" name="show_browser">1</dc5par>
<dc5par type="string" name="give_control_to_user_xpath">//form[@id="captcha-form"]</dc5par>
или
<dc5par type="int" name="show_browser">1</dc5par> <dc5par type="string" name="give_control_to_user_xpath">//input[@name="__RequestVerificationToken"]</dc5par>
1я строка включает отображает окно браузера при парсинге, 2-я строка определяет наличие рекапчи на странице и передает управление нам, т.е мы можем решить рекапчу или просто отметить галочку, что мы не робот.
После решения рекапчи в браузере нужно будет нажать кнопку "Продолжить", чтобы парсер продолжил сбор данных.
P.S чтобы сократить шанс появления любоговида капчи используйте прокси.
Хорошие прокси от 33р за шт можно купить тут
И напоминаю, что по моей партнерской ссылке Вы получите 20% скидки на любой тариф, при покупке Датакол. Например, годовая лицензия будет стоить 6070руб. вместо 7590р.
Респект, олично работает. Поменялась страничка там
//form[@id="captcha-form"]
Спасибо, заменил в материале
Страничка видимо снова поменялась. Не срабатывает в хроме ver.102.0.5005.63. Не открывается страница чтобы решить капчу. Парсинг проскакивает до конца. Напишите, пожалуйста, как поправить?
Страница действительно поменялась. Сейчас работает так:
<dc5par type="int" name="show_browser">1</dc5par>
<dc5par type="string" name="give_control_to_user_xpath">//input[@name="__RequestVerificationToken"]</dc5par>
Спасибо, добавил в материал