Парсер бессмертного полка
1700 UAHНеобходимо написать парсер сайта moypolk.ru, реализация на php, python или nodejs, должен работать на ubuntu 16.04. Парсинг должен проходить в два этапа:
1. заходим на страницу https://www.moypolk.ru/search и парсим ссылки на людей. Всего тут 21к+ страниц, нужно спарсить ссылки на всех людей 420к+. Ссылки записываем в текстовый файл
2. Заходим на каждую страницу из спаршенных ссылок, допустим ссылка https://www.moypolk.ru/irkutsk/soldiers/katyshevcev-fedor-alekseevich. Создаем локально папку с названием katyshevcev-fedor-alekseevich+десять рандомных букв латиницы и цифр. В нее сохраняем фотографию, а так же создаем файл data.json, в файл вписываем ФИО солдата, звание http://prntscr.com/mqa38o. Если на странице есть дополнительные фотографии, их тоже сохраняем в папку http://prntscr.com/mqa4b0. Так же в файл data.json сохраняем путь к этой фотографии в интернете, т.е. откуда ее скачали. Файл data.json - выдам пример, так как нужно соблюсти синтаксис.
Для работы второго этапа подается файл с ссылками из первого этапа, во время работы ссылки должны удаляться из файла, так как если остановилась работа парсера, то продолжаться она должна с того места, где остановилась.
Отзыв заказчика о сотрудничестве с Sergey Mironov
Парсер бессмертного полкапроект выполнен успешно, рекомендую к работе
![]()
-
42 4 1 1 Здравствуйте, готов взяться за выполнение это задание.
Т.к. интересно + пишу подобные парсеры
-
4080 51 0 Здравствуйте, я специализируюсь на разработке парсеров на Node.js. Реализую этот парсер в наилучшем виде, учту все Ваши пожелания. Парсер будет быстрым. Пи работе с VPS проблем не будет, так как большое количество моих проектов работают в облаке. Также могу прикрутить веб-админку, с помощью которой можно будет скачать data.json или текстовый файл.
Буду рад с Вами поработать!
С уважением, Куприенко Вилен.
Telegram: t.me/vilkup
Email: [email protected]
-
6334 144 6 4 День добрый
Готов реализовать на Питоне. По срокам - 2-3 дня. Только ссылки лучше сохранять не в текстовом файла. а в базе данных, потому что многопоток с текстовым файлом будет коряво работать
-
1101 15 0 Здравствуйте!
Ознакомился с Вашим заданием, смогу все это выполнить, у Вас есть ТЗ? А то вопросов много есть еще
-
1238 83 0 1 Здравствуйте. Без проблем могу сделать парсер на PHP или на NodeJs. Приступить могу прямо сейчас :)
Актуальные фриланс-проекты в категории Javascript и Typescript
Интернет-магазин одеждыНужен разработчик для интернет-магазина одежды Ищу опытного разработчика для создания полноценного интернет-магазина одежды с дроп-моделью продаж. Что нужно сделать: 6 страниц: главная, товар, корзина, оформление, аккаунт, админ панель Вход через Google аккаунт Корзина и… HTML и CSS верстка, Javascript и Typescript ∙ 1 день 5 часов назад ∙ 81 ставка |
Full-stack разработка — Amazon PPC Dashboard (Stage 1)Нужен full-stack разработчик с опытом работы с Amazon API для реализации Stage 1 внутреннего PPC-дашборда. Проект реальный, данные живые, всё готово к старту. Прототип фронтенда (5 страниц, React + TypeScript): ЧТО УЖЕ ГОТОВО — Фронтенд-прототип на React 18 + TypeScript + Vite… Javascript и Typescript, Веб-программирование ∙ 3 дня 16 часов назад ∙ 29 ставок |
Разработка сайта-конструктора фотокниг и фоторамокЦель проекта Необходимо разработать современный веб-сайт для заказа фотокниг, фоторамок и другой персонализированной фотопродукции. Главная задача проекта — предоставить клиенту возможность самостоятельно создать готовый макет изделия непосредственно на сайте без участия… Javascript и Typescript, Веб-программирование ∙ 5 дней 8 часов назад ∙ 98 ставок |
Команда для самописного маркетплейса ритуальных услуг.Ищем команду для запуска и развития самописного национального маркетплейса ритуальных услуг. Сразу: не ищем одиночек, джунов и “сборщиков сайтов”. Нужна сильная продуктовая команда уровня middle+/senior с реальными кейсами маркетплейсов/сложных SaaS. Просьба не откликаться,… Javascript и Typescript, Веб-программирование ∙ 6 дней 3 часа назад ∙ 27 ставок |
Доработка существующего Next.js/Supabase проекта: офферы, CRM, аналитика, AI-чатЕсть действующий проект WatchGenius — платформа аналитики люксовых часов с каталогом моделей, ценовой аналитикой, внешними офферами, формами заявок и AI-чатом. Проект уже разработан частично. Нужен не сайт с нуля, а опытный full-stack разработчик, который сможет разобраться в… Javascript и Typescript, Веб-программирование ∙ 8 дней 4 часа назад ∙ 55 ставок |