Сегодня хочу поговорить о простом и бесплатном парсере. Он поможет Вам быстро собрать небольшой объем данных с текущей страницы. Это не отдельная программа, а так сказать парсер расширение для Хрома.
Называется это дополнение Scraper. Скачать его можно по ссылке.
Хоть он и не обновляется с 2015 года, но поверьте, он часто может Вас выручить, когда нужно собрать данные за 1 минуту. Правда интересно? Давайте сразу попрактикуемся.
Бесплатный парсер ключевых слов с Вордстат (Wordstat)
Например, Вам нужно быстро подобрать ключи по запросу "пластиковые окна" по Москве и области.
- Заходите на Вордстат
- Выбираете регион
- Вводите ключ
P.S не забудьте скачать дополнение! Поехали!
Видим результат: https://wordstat.yandex.ru/#!/?regions=1&words=%D0%BF%D0%BB%D0%B0%D1%81%D1%82%D0%B8%D0%BA%D0%BE%D0%B2%D1%8B%D0%B5%20%D0%BE%D0%BA%D0%BD%D0%B0
- Выделяем мышкой два заголовка таблицы с ключами "Статистика по словам" и "Показов в месяц". Только выделяйте четко по словам, чтобы не захватить лишнее.
- Нажимаем правой кнопкой мыши на любом выделенном столбцеи в контекстном меню выбираем "Scrap similar", как показано ниже на скриншоте
И видим замечательный результат нашей работы
Теперь Вы можете скопировать данные в буфер обмена или загрузить на Гугл диск. Если Гугл таблицы Вам не нужны, то просто копируйте и потом открывайте Excel или Calc и вставляйте. Данные прекрасно переносятся.
Парсим ссылки с карты сайта (sitemap.xml)
Ранее, я уже рассказывал, как можно собрать ссылки с сайта через карту сайта с помощью Datacol, и дальше уже собирать нужные нам данные.
В этом примере рассмотрим, как можно быстро взять ссылки с карты сайта и затем их использовать как стартовые, для начала полноценного парсинга.
Возьмем к примеру, карту сайта для категорий с моего сайта, перейдем на нее и нажмём правойкнопкой мыши на первой ссылке
И получаем список ссылок
Собираем ссылки с меню
Также возьмем в пример рассмотренную ранее статью по сбору URL из меню.
Перейдем на офф сайт Дататкола, выбираем меню Решения и далее правой кнопкой мыши на первом пункте меню "ПАРСЕРА ИНТЕРНЕТ МАГАЗИНОВ" и "Scrap similar".
Получаем ссылки на разделы меню решения + их заголовки
Это только некоторые примеры использования этого расширения. И одно замечание, не всегда возможно корректное автоматическое определение xpath, поэтому желательно чтобы Вы немного ориентировались в его подборе и также работе с инструментом разработчика в браузере, чтобы можно было подобрать значения.
Также хочу отметить, что этот простой парсер сайта и годится он для простых и средних задач и данных которые находятся на одной странице. Если Вам нужен полноценный парсер, тогда используйте проверенный Datacol.
И напоминаю, что по моей партнерской ссылке Вы получите 20% скидки на любой тариф, при покупке Датакол. Например, годовая лицензия будет стоить 4400руб. вместо 5500р.