Парсинг email из вакансий
Здравствуйте уважаемые исполнители, нужно реализовать следующую задачу:
Спарсить email из вакансий на сайте https://ec.europa.eu/eures/portal/jv-se , по списку специальностей и локации “Германия” (список специальностей предоставлю). Возможно будет необходимо использовать Proxy.
Получение email необходимо обработать, для дальнейшей вставки в mongoDB (очень краткое описание, детально ниже):
1.Оставить уникальные emails, повторяющиеся удалить.
2.Проверить валидатором “живые” email, не валидные удалить (есть онлайн API для этого).
3.Получить мейлы из mongoDB и сравнить с полученными, убрав совпадающие email (типа как сравнения таблиц в sql).
Парсер нужно будет “интегрировать к логической системе” , так как парсеров будет несколько и нужно чтобы мейлы всегда были уникальны и не пересекались с мейлами из других парсеров (процедура отсеивания дублей).
Детально и пошагово как всё должно работать описано здесь (при выборе исполнителя продублирую эту инструкцию в личку):
https://docs.google.com/document/d/1pHPi4xTbIzfCVyoaQc3FQcu4M2TGA5CHJGVLumOIDEQ/edit?usp=sharing
Если будет необходима дополнительная информация, можем созвониться, так как система может показаться немного запутанной, но на самом деле сам парсер это 80% работы, остальное просто получение данных/ отсеивание / запись.
Требования к исполнителю:
1. Знание технологии на которой будет писаться парсер, на должном уровне и соответственно опыт работы;
2. Опыт работы с парсерами;
3. Mongodb (в нем храниться весь результат работы парсеров);
4. Опыт работы с установкой и настройкой VPS;
Просьба делать всё аккуратно, так на vps уже есть другие парсеры написаны на Pyton и запущены процессы. Также установлен и настроен cron для ежедневного запуска парсеров и дополнительных функций.
Бюджет на проект не большой, но работа не одноразовая, так как надо еще будет написать аналогичные парсеры, их функционал и логика будет аналогичным как описано выше, только другой сайт.
Просьба также указать используемые технологии для парсинга.
Спасибо за внимание, жду ваших предложений.
Актуальные фриланс-проекты в категории Базы данных и SQL
ТЗ: Дашборд на Dune AnalyticsРеференс по стилю: dune.com/filarm/polymarket-activity Задача Сделать красивый дашборд на Dune по нашему боту для Polymarket. Реальных данных нет — всё генерируется синтетически, но выглядит логично и правдоподобно. Главное требование Дашборд должен работать постоянно и… Базы данных и SQL, Криптовалюта и blockchain ∙ 4 часа 29 минут назад ∙ 3 ставки |
Работа с BAS CORPЗдравствуйте! В настоящее время необходимо выполнение следующих задач: Корректировка печатной формы в BAS КОРП по параметрам клиента. А именно задача не выводить определенные поля. Обновление классификатора профессий BAS КОРП по ряду предприятий. Перенос БД из 1С8 в BAS КОРП… Интеграция платежных систем, Базы данных и SQL ∙ 16 часов 18 минут назад ∙ 7 ставок |
Нужен специалист 1С для доработок и разработкиИщу специалиста по 1С для сотрудничества на фрилансе. В настоящее время уже работаю с подрядчиком, который обеспечивает поддержку и обслуживание системы 1С. Однако из-за загруженности подрядчика возникает необходимость в оперативном выполнении дополнительных задач, доработок и… Базы данных и SQL ∙ 1 день 22 часа назад ∙ 11 ставок |
Восстановление инстаграм после блокировки3 марта 2026 г заблокировали инстаграм с причиной нарушения правил. Считаю произошла какая то ошибка, так как страничка была личной с фото и видео личных поездок. Коментарии и тд я не писала нигде. Отправляла несколько раз на обжалование. Не могу скачать свои файлы, так как не… Базы данных и SQL, Веб-программирование ∙ 2 дня 10 часов назад ∙ 4 ставки |
Устранить проблему неполного импорта данных из Excel-файлов спецификаций Новой Почты в 1С:
2000 UAH
Цель: Есть обработка в 1с по загрузке спецификации Новой почти. По непонятнім причинам перестало подгружать некоторіе табличніе данніе Нужно найти причину и Устранить проблему неполного импорта данных из Excel-файлов спецификаций Новой Почты в 1С: Малый Бизнес. Текущее… Администрирование систем и сетей, Базы данных и SQL ∙ 5 дней 17 часов назад ∙ 16 ставок |