Ранее я уже писал о этом расширении, и оно уже на тот момент устарело, но хорошо работало. Но Гугл поменял правила и все расширения должны были перейти на Manifest V3 (MV3).
Оно меня часто выручало, когда нужно быстро собрать данные с одной или нескольких страниц. И я решил его адаптировать под реалии и свои небольшие хотелки. А именно:
- обновление на Manifest V3 (MV3)
- обновление всех библиотек, которые использует расширение jquery, jquery-ui, datatable, layout-jquery3, tablednd
- доработан механизм сбора данных с фреймов
- копирование данных в буфер обмена
- копирование данных без заголовков
- экспорт/импорт пресетов
- сохранение данных в CSV и XML
- локализация на 2 языка РУ/АНГЛ
Самое важно, это не универсальный комбайн и скорее всего не подойдет совсем новичкам без базовых знаний html.
Это расширение поможет Вам быстро собрать небольшой объем данных с текущей страницы. Для этого нужно сделать правой кнопкой мыши на элементе, который нужно собрать, например по одной из ссылок в группе и дальше выбрать "Scrap similar ..." или "Извлечь похожие ...".
Еще один вариант это выделить первую строку в данных, например в таблице, чтобы собрать в несколько колонок.
Давайте рассмотрим на реальных примерах.
Бесплатный парсер ключевых слов с Вордстат (Wordstat)
Например, Вам нужно быстро подобрать ключи по запросу "пластиковые окна" по Москве и области.
- Заходите на Вордстат
- Выбираете регион
- Вводите ключ
Видим результат: https://wordstat.yandex.ru/?region=all&view=table&words=%D0%BF%D0%B0%D1%80%D1%81%D0%B8%D0%BD%D0%B3
- Выделяем мышкой два заголовка таблицы с ключами "Запросы по словами" и "Число запросов". Только выделяйте четко по словам, чтобы не захватить лишнее.
- Нажимаем правой кнопкой мыши на любом выделенном столбце в контекстном меню выбираем "Извлечь похожие ...", как показано ниже на скриншоте

И видим замечательный результат нашей работы

Теперь Вы можете скопировать данные в буфер обмена или выгрузить в csv/xml. Данные прекрасно переносятся.
Парсим ссылки с карты сайта (sitemap.xml)
В этом примере рассмотрим, как можно быстро взять ссылки с карты сайта и затем их использовать как стартовые, для начала полноценного парсинга.
Возьмем к примеру, карту сайта для категорий с моего сайта, перейдем на нее и нажмём правойкнопкой мыши на первой ссылке

И получаем список ссылок

Собираем ссылки на объявления с Авито
Открываем нужный нам раздел Авито и нажимаем правой кнопкой на один из заголовков

Получаем ссылки на объявления и из заголовки

Это только некоторые примеры использования этого расширения. И одно замечание, не всегда возможно корректное автоматическое определение xpath, поэтому желательно чтобы Вы немного ориентировались в его подборе и также работе с инструментом разработчика в браузере, чтобы можно было подобрать значения.
Также хочу отметить, что этот простой парсер сайта и годится он для простых и средних задач и данных которые находятся на одной странице. Если Вам нужен полноценный парсер, тогда можете обратиться ко мне для разработки парсера для ваших нужд или разового сбора данных
Также возможен дальнейших импорт данных на Ваш сайт.
Если будет спрос на дополнение, возможно дополню его автоматизацией, ии и другим функционалом.
Как добавить своё расширение в Chrome
- Разархивируйте расширение в любую папку
- Откройте Chrome и перейдите на
chrome://extensions - Включите «Режим разработчика» (переключатель в правом верхнем углу)
- Нажмите «Загрузить распакованное расширение»
- Выберите папку с файлами вашего расширения (там должен быть
manifest.json) - Расширение появится в списке и сразу заработает


