Парсинг архіву з сайту
Є сайт, на якому кожного дня публікують архіви. Потрібно написати скрипт, який би кожного дня заходив на сторінку і завантажував архів.
Проблема в тому, що сам список архівів підвантажується через js, як я розумію, і там немає як такої посилання на архів, а посилання формується в процесі і з тимчасовим кодом дії цієї посилання. Скрипти з gpt з локального комп'ютера завантажують архів, але з сервера ні. Точніше, завантажується архів, а в ньому не xml, як має бути, а html з помилкою.
Ось одна з сторінок, на якій потрібно завантажувати архів
https://data.uspto.gov/bulkdata/datasets/trtdxfap?fileDataFromDate=2025-06-28&fileDataToDate=2025-08-27
Всього 2 сторінки.
Подивіться, будь ласка, наскільки реально це обійти і завантажувати архів кожного дня?
Відгук замовника про співпрацю з Володимиром Нікольським
Парсинг архіву з сайтуЗ завданням впорався швидко і завжди був на зв'язку! Рекомендую і буду ще звертатися за допомогою!
Відгук фрилансера про співпрацю з Артуром К.
Парсинг архіву з сайтуДякую за співпрацю, чудовий замовник!
-
Добрий день. Взагалі не проблема. Напишу код на python Selenium, зможете запускати його як на локальній машині, так і на сервері. Захист на сайті не дуже сильний, обійти проблеми не буде. Готовий виконати до кінця вихідних. Буду радий співпраці
Буду радий співпраці! -
Вітаю, близько двох років займаюсь розробкою парсерів, реалізую все швидко та якісно, також, налаштую щоденну роботу
-
945 31 1 доброго дня. Готовий обговорити детальніше в ЛС. Де знаходиться файл саме за цим посиланням і як формуються посилання теж) Для цього посилання накидав і працює.
-
751 9 0 Привіт, зроблю вам парсер на c# для скачування архівів, сторінку за посиланням подивився, можливо скачати, більш детально можна обговорити в особистих повідомленнях
ось невеликий тест
https://postimg.cc/z3CkYK9J
-
1722 4 0 Так, завдання реальне, але є нюанси через те, що посилання на архів генерується динамічно через JavaScript і має тимчасовий токен. Тому просто requests.get() з сервера не працює — сервер повертає HTML з помилкою, а не XML.
-
3313 70 1 Вітаю, коротко ознайомився із сайтом, там є api для взаємодії, зможу допомогти
Скрипт буде на javascript. Сервер є де розмістити скрипт із цим потрібна допомога?
-
418 2 0 Пропоную простий сервіс, який буде раз в день/або у вказаний інтервал перевіряти актуальність завантажених файлів.
Також можливо по запиту: запустили - отримали оновлення
можна оформити в api для для доступу с ваших програм.
Стек: nodejs, можливо докер
-
1616 8 0 Привіт,
Я розробник у сфері AI/ML та WEB SCRAPING. Зможу виконати Ваш проект. Напишіть мені, обговоримо.
-
882 29 1 Доброго дня.
У мене великий досвід написання парсерів. Зроблю швидко і якісно.
Чекаю Вашого повідомлення.
-
10946 224 0 1 Добрий день) Я подивився сайт, і зрозумів, що можна спокійно скачати на пайтоні) Захисту як такого не бачу.
Вони забули приховати шляхи до апі, і навіть не вимагають токен, тому це буде легко.
Потрібно кілька уточнень і можемо приступати.
Ось тут можна подивитися, що всі файли як на долоні: https://ibb.co/N8GvqM1
-
3392 84 0 Готовий взятися.
Треба уточнити деталі замовлення, пишіть!
Використовую python, uv, github, docker.
-
6256 74 1 Добрий день. подивився структуру сайту. там є де брати посилання на архіви по будь-якій даті.
Пишіть, обговоримо ваше завдання, буду радий допомогти.
Актуальні фриланс-проєкти в категорії Веб-програмування
Оновлення односторінкового сайту надання будівельних послуг
1000 UAH
Оновлення діючого односторінкового самописного сайту надання будівельних послуг Завдання: -Редизайн сайту -Додавання категорій послуг шляхом створення мультилендінгу на 6 категорій -Додавання до кожної категорії фото та опису робіт -Оптимізація реклами сайту Розгляну… Веб-програмування ∙ 2 години 1 хвилина тому ∙ 41 ставка |
Допрацювання Front-end e-com сайта на OpencardПотрібно допрацювати front-end e-commerce сайту на OpenCart. Основні задачі: виправити візуальні баги, адаптивність під мобільні пристрої, покращити відображення карток товарів, категорій, кошика та сторінки оформлення замовлення. Очікується акуратна верстка, збереження… CMS, Веб-програмування ∙ 3 години 50 хвилин тому ∙ 32 ставки |
Розробка форми збору лідів перед завантаженням програми (MODX)Сайт:bricscad-ukraine.com.uaCMS: MODXМета: Створити механізм збору лідів перед завантаженням програмного забезпечення для 3-х версій Windows, MacOS, Linux з сайту для подальшої обробки відділом продажів. Веб-програмування ∙ 7 годин 19 хвилин тому ∙ 26 ставок |
Видалити віруси з сайту і оновити плагіни (Wordpress)Потрібен WordPress-спеціаліст для технічного доопрацювання сайту Завдання: Очистити сайтhttps://www.mast-agency.com/ від вірусів/шкідливого коду, файлів; (на сайті вірус який робить сторінки і редіректи на чужий магазин) Оновити плагіни, щоб сайт працював і виглядав після… CMS, Веб-програмування ∙ 10 годин 51 хвилина тому ∙ 68 ставок |
Зробити щоб листи про замовлення з магазину не потрапляли в спамЗараз є магазин на опенкарті, листи про замовлення потрапляють до спаму, треба зробити так щоб потрапляли в Вхідні (ukr.net gmail) перевірити. хостинг написав: Погана доставка електронної пошти може бути пов'язана з низькою репутацією відправника - IP або домену. У такому… PHP, Веб-програмування ∙ 11 годин 55 хвилин тому ∙ 45 ставок |