• Datacol
  • Парсеры
  • Opencart
  • Полезное
  • Soft
  • Контакты
  • Datacol
  • Парсеры
  • Opencart
  • Полезное
  • Soft
  • Контакты
  • Купить Datacol со скидкой 20%
  • Заказать настройку Датакол
  • КУПИТЬ ПРОКСИ

BestWeb4U BestWeb4U

Datacol, Opencart, WordPress и не только

  • Datacol
  • Парсеры
  • Opencart
  • Полезное
  • Soft
  • Контакты
Datacol, Проекты

Как найти архив сайта

Для тех, кто связан созданием сайтов, дропами, сетками сайтов и тому подобное не нужно объяснять, как полезен сайт web.archive.org (веб архив орг).

Основная его задача посмотреть web архив сайтов которых уже нет в поисковой выдаче. Т.е. контент сайта и его структура, который был размещен на нем ранее. Конечно, архив есть не для всех сайтов. В основном для активных сайтов, которые развивались.

Как посмотреть архив сайта

Все просто, открываем сайт http://web.archive.org/ и вводим нужный сайт в строку поиска.

Далее, если у сайта есть архив, Вы увидите даты, в виде календаря, за которые имеются архивы. Нужно просто выбрать дату, для открытия сайта.

Как посмотреть архив сайта

Еще можно проверить архив сайта сразу написав в адресной строке браузера

https://web.archive.org/web/*/ + нужный сайт, например

https://web.archive.org/web/*/https://bestweb4u.net/

Рассмотрим случай, когда Вы хотите купить домен, не новый, но который уже закончился, но скажем у него уже есть ссылочная масса, ИКС и другие показатели. Такой сайт будет проще продвинуть. А еще лучше будет восстановить его структуру и контент. В таком случае поисковики быстро обойдут его, и все восстановят. И Вы начнете получать трафик. Понятно, что это очень идеальный вариант.

Именно в этом случае Вам поможет Веб Архив. Найти такой домен тяжело, и нужно чтобы еще и архив был. Зачастую приходится проверить много сайтов на доступность архива.

Парсер веб архива (web.archive.org)

У меня недавно была такая нужда. И так как я пользуюсь универсальным парсером Datacol, то без труда набросал проект, который поможет в этом.

Это готовый проект парсер/чекер web.archive.org под Датакол. Парсер веб архива проверяет каждый сайт и находит дату первого архива, дату последнего архива и отдельно параметр есть сайт в архиве или нет. Хотя если есть даты, то и так понятно, что сайт есть в архиве. Для проверки нужно всего лишь подготовить список сайтов или доменов. На выходе получите CSV файл с данными по каждому сайту.

Парсер веб архива (web.archive.org)

Парсер web.archive.org абсолютно бесплатный и скачать его может каждый. Настройка очень проста. Просто задаете список доменов/сайтов в список начальных URL и в экспорте задаете папку для сохранение итогового файла. По умолчанию в корень диска D.

Парсер web.archive.org

Icon
Парсер/чекер веб архива (web.archive.org) 44 Kb
Download

Для тех, кто не знаком с Датакол, можно ознакомится с возможностями на офф сайте. И также получить скидку 20% на его покупку.

Если Вам нужна доработка парсера под свои нужды, пишите в форму ниже.

Written by Администратор in 22.11.2018 / 295 Wiews
Tags | архив, веб архив, парсер

You Might Also Like

Простой и бесплатный парсер сайта

Простой и бесплатный парсер сайта

07.12.2018
сбор контактов с пром юа

Парсер контактов prom.ua

10.01.2019

Массовая проверка ИКС сайтов

01.12.2018

Отправить ответ

avatar
500
Рейтинг
wpdiscuz_captcharefresh
avatar
500
wpdiscuz_captcharefresh
  Подписаться  
Уведомление о
Previous Post
Next Post

Заработок 2.1%/день

Заработай - 3000% ЗА 60 ДНЕЙ

Разделы

  • Datacol
    • Cases
    • FAQ
    • Динамические плагины
    • Проекты
  • Opencart
  • Soft
  • Парсеры
  • Полезное

Последние записи

  • Получаем несколько значений в одно поле Датакол 14.02.2019
  • Добавляем модулю свой class или id. OpenCart 11.02.2019
  • Импорт в базу данных MYSQL 24.01.2019
  • Парсер контактов prom.ua 10.01.2019
  • Парсинг Liveinternet 30.12.2018

Свежие комментарии

  • Администратор к записи Загрузка данных с другой страницы
  • Андрей к записи Загрузка данных с другой страницы
  • Андрей к записи Загрузка данных с другой страницы
  • Администратор к записи Загрузка данных с другой страницы
  • Андрей к записи Загрузка данных с другой страницы

BestWeb4U. Блог о парсинге. Datacol и не только

wpDiscuz