Парсинг архива с сайта
1000 UAHЕсть сайт на котором каждый день публикуют архивы. Нужно написать скрипт, который бы каждый день заходил на страницу и скачивал архив.
Проблема в том, что сам список архивов подгружается через js как я понимаю и там нет как таковой ссылки на архив, а ссылка формируется в процессе и с временным кодом действия этой ссылки. Скрипты с gpt с локального компьютера скачивают архив, но с сервера нет. Точнее скачивается архив, а в нем не xml как должно быть, а html с ошибкой.
Вот одна из страниц на которой нужно качать архив
https://data.uspto.gov/bulkdata/datasets/trtdxfap?fileDataFromDate=2025-06-28&fileDataToDate=2025-08-27
Всего 2 страницы.
Посмотрите пожалуйста на сколько реально это обойти и скачивать архив каждый день?
Отзыв заказчика о сотрудничестве с Володимиром Нікольським
Парсинг архива с сайтаС задачей справился быстро и всегда был на связи! Рекомендую и буду еще обращаться за помощью!
Отзыв фрилансера о сотрудничестве с Артуром К.
Парсинг архива с сайтаСпасибо за сотрудничество, отличный заказчик!
-
Добрый день. В общем, не проблема. Напишу код на python Selenium, сможете запускать его как на локальной машине, так и на сервере. Защита на сайте не очень сильная, обойти проблемы не будет. Готов выполнить до конца выходных. Буду рад сотрудничеству.
-
Здравствуйте, около двух лет занимаюсь разработкой парсеров, реализую все быстро и качественно, также настрою ежедневную работу
-
948 31 1 здравствуйте. Готов обсудить подробнее в ЛС. Где находятся файл именно по этой ссылке и как формируются ссылки тоже) Для этой ссылки накидал и раотает.
-
751 9 0 Здравствуйте, сделаю вам парсер на c# для скачивания архивов, страницу по ссылке посмотрел, возможно скачать, более детально можно обсудить в личке
вот небольшой тест
https://postimg.cc/z3CkYK9J
-
1722 4 0 Да, задача реальная, но есть нюансы из-за того, что ссылка на архив генерируется динамически через JavaScript и имеет временный токен. Поэтому просто requests.get() с сервера не работает — сервер возвращает HTML с ошибкой, а не XML.
-
3318 70 1 Привет, кратко ознакомился с сайтом, там есть api для взаимодействия, смогу помочь
Скрипт будет на javascript. Сервер есть где разместить скрипт с этим нужна помощь?
-
370 2 0 Предлагаю простой сервис, который будет раз в день/или в указанный интервал проверять актуальность загруженных файлов.
Также возможно по запросу: запустили - получили обновление
можно оформить в api для доступа с ваших программ.
Стек: nodejs, возможно докер
-
1616 8 0 Здравствуйте,
Я разработчик в сфере AI/ML & WEB SCRAPING. Смогу выполнить Ваш проект. Напишите мне, обсудим.
-
882 29 1 Добрый день.
У меня большой опыт написания парсеров. Сделаю быстро и качественно.
Жду Вашего сообщения.
-
10958 224 0 1 Добрый день) Я посмотрел сайт, и понял что можно пайтоном спокойно скачать) Защиты как таковой не вижу.
Они забыли скрыть пути к апи, и даже не требуют токен, поэтому это будет легко.
Нужно пару уточнений и можем приступать.
Вот тут можно посмотреть что все файлы как на ладони: https://ibb.co/N8GvqM1
-
3392 84 0 Готов взять на себя.
Нужно уточнить детали заказа, пишите!
Использую python, uv, github, docker.
-
6262 74 1 Добоый день. посмотрел структуру сайта. там есть где брать ссылки на архивы по любой дате.
Пишите, обсудим вашу задачу, буду рад помочь.
Актуальные фриланс-проекты в категории Веб-программирование
Интеграция GoPosПривет, делал кто нибудь интеграцию GoPos с кастомным сайтом для ресторана в Польше? Нужна помощь, у них очень скудная документация, есть только swagger и тот без описаний https://app.gopos.io/doc/swagger-ui/index.html Суть такая, использовали от них сайт для онлайн заказов,… PHP, Веб-программирование ∙ 30 минут назад ∙ 7 ставок |
Разработка современного сайта для Театра
10 000 UAH
Ищем веб-разработчика для создания официального сайта современной культурной платформы. Проект объединяет театральные, художественные, образовательные и культурные инициативы. Необходимо создать современный адаптивный сайт, который будет одновременно выполнять имиджевую функцию,… CMS, Веб-программирование ∙ 1 час 7 минут назад ∙ 38 ставок |
ИИ-агент технолога спортивного питанияАгент помогает разрабатывать рецептуры новых продуктов спортивного питания — протеиновых батончиков, протеинов, предтреников, изотоников, батончиков и т.д. Главная особенность: агент знает законодательство разных стран и автоматически учитывает его при создании рецептуры. То… AI и машинное обучение, Веб-программирование ∙ 1 час 24 минуты назад ∙ 24 ставки |
Разработка корпоративной финансовой системы — React, TypeScript, Node.jsИщем опытного full-stack разработчика или небольшую команду для разработки корпоративной финансовой системы с нуля. Необходимо реализовать полный цикл разработки: проектирование архитектуры, backend, frontend, базу данных, тестирование и запуск системы. Технологии: Frontend:… Javascript и Typescript, Веб-программирование ∙ 1 час 55 минут назад ∙ 35 ставок |
Syrve/iiko + LiqPay: QR-меню, заказы со стола, чаевые, подтверждение официантомНужен разработчик / интегратор для ресторана, который имеет опыт с Syrve/iiko или подобными POS-системами. Задача: реализовать или спроектировать интеграцию QR-меню и QR-оплаты для ресторана через Syrve/iiko и PrivatBank/LiqPay. Нужна схема работы: На каждом столе есть QR-код.… Веб-программирование ∙ 3 часа 57 минут назад ∙ 17 ставок |