Сегодня на форуме Датакол увидел очередную просьбу помочь скачать фото у которого не указано расширение.
Происходит это так, вы подбираете регулярку или xpath, включаете сохранение тегов, видиди что все работает. Дальше включаете загрузку файлов и получаете пустое поле.
По умолчанию Datacol скачивает фото или любые другие файлы у которых указано расширение из списка
А также файл или фото должны находится в теге <a> или <img> и соответственно в атрибутах href или src.
Итак, вернемся к решению проблемы. Есть 2 варианта решения:
- Просто удаляем все указанные расширения и в поле "Конечное расширение" указываем ".jpg" или другое нужно расширение.
- Указываем "псевдо" расширение "&.jpg" с помощью замен. К примеру вы получаете такую ссылку на фото https://images.interhome.com/ES9564.100.1/large/67683-1-546470-1437343569 и с помощью замены добавляете к концу строки "&.jpg" с помощью регулярного выражения $ на &.jpg.
P.S если у Вас поле получает прямую ссылку на фото, а не в тегах <a> или <img>, то нужно еще прописать правило идентификации ссылки, т.к по умолчанию для скачивания ссылка должна быть в тегах <a> или <img>:
^(.*?)$
>> то нужно еще прописать правило идентификации ссылки
в этом случае в ячейках можно будет сохранить сами ссылки на фото?
Чтобы сохранилась только ссылка правило идентификации не нужно, это только для скачивания. Если вы хотите и ссылку оставить и скачать, тогда указывайте Возвращаемое значение - Ссылка.
А если ссылка на картинку вот такого вида:
https://images.lady.mail.ru/683079/
Картинка не парсится.
Физически фото лежит по адресу
Как бы его получить?
Вы сами посмотрите на ссылку картинки которую вставили. У нее ссылка т.е вам заменой нужно после косой еще раз продублировать название и добавить расширение.
Как-то так /([d]{4,10})/ -> /$1/$1.jpg
Спасибо, но что-то не работает условие замены. В данном примере 4,10 - это что?
Вы отметили в заменах что это реулярка? 4,10 это означает что цифр может быть от 4х до 10
Да, отметил. Именно замена не происходит. Если отмечаю "возвращать полное значение", то при тестировании видно, что отдается путь к картинке БЕЗ этой замены, соответственно кратинка не скачивается и не сохраняется.
Извиняюсь, редактор удаляет слеш перед d. Вот замена
http://prntscr.com/fdh7sg
P.S проверяйте всегда без включенного режима загрузки и только когда видите что ссылка работает - включайте загрузку.
Отлично, все работает, спасибо.
Доброго вечера. Может вопрос не в тот огород, но.. подскажите как при парсинге галерей сделать так чтобы фотографии галереи были в отдельных папках.
Выставлял в настройках генерация подпапок по названию но парсин все равно все в кучу
Значит что-то не так. Поле, которое используете для названия должно идти до поля с фото.
Заработало, второй день ковыряю, даже не знаю что сделал!!!! но заработало, наверное что-то связаное с тегами в настройках этого самого поля
Дак в том и дело что не работает эта функция. Ставлю %url% в настройке вырезаю домен, получается должна создаться папка аля bol-v-pupke - и не создается....А если применить например %title% где русские слова - то работает, но это не верно! зачем нужны папки для вото с длиной в 100 символов
http://www.metr-plus.com.ua/img.php?id=236149&size=12
Подскажите , а как такое фото спарсить?
А что у Вас не получается? У Вас как раз 1й вариант решения из этой статьи.
Добрый день.
Помогите пожалуйста сс этой фото https://emex.ru/Find2/Find/GetDetailImage?detailKey=gdft6uwx7arw6mr3ygfw2mr3tjvq2&detailImageId=9576502
Все способы что здесь перечислены не помогают.
Самый простой вариант это добавить в конце к ссылке &.jpg
https://emex.ru/Find2/Find/GetDetailImage?detailKey=gdft6uwx7arw6mr3ygfw2mr3tjvq2&detailImageId=9576502&.jpg
она также открывается, но у нее получается будет расширение и можно булет скачать.
Здравствуйте.
С ссылкой кажется проблем нету,
https://www.x-kom.pl/p/590626-smartfon-telefon-samsung-galaxy-s20-fe-5g-fan-edition-niebieski.html
Но картинка не парсится, xpath, и regex какие я только не пробовала. Помогите пожалуйста.
Фото лежит по адресу
Думаю проблема в капче. У меня при переходе по ссылке и конкретно в фото сработала капча. Там срабатывает hCaptcha. Мне ее не удалось распознать через браузер или плагин хрома. Сколько не решай ее, все равно не пропускает.
Спасибо за быстрый ответ