Парсер заказа
Ищу разработчика Python для создания стабильного парсера вакансий с сайта Bundesagentur für Arbeit (https://www.arbeitsagentur.de/jobsuche/.
Финальный инструмент должен собирать вакансии из списка и jobdetail-страниц, применять обязательные фильтры и возвращать структурированную таблицу под мои колонки.
В проекте предусмотрен простой дашборд (веб-интерфейс), чтобы я мог сам запускать сбор (ключевое слово, город/радиус, период публикации), нажать «Старт» и получить готовый Excel/CSV/Google Sheet.
Важно: на BA есть капча (hCaptcha).
Материалы, которые я прикреплю к проекту
Job Page.png — показывает, где именно брать: Position, Unternehmen, Straße und Hausnummer, PLZ/Ort, Ansprechperson (AP), Telefon, E-Mail, Homepage, Veröffentlichungsdatum, Referenz-Nr. (nr.), Einsatzort, Link auf Anzeige.
Filters BA.png — показывает, какие фильтры обязательно включать перед парсингом:
Zeitarbeit ausschließen (исключить)
Externe Stellenbörsen ausschließen (исключить)
Veröffentlichungsdatum (период: 24h / 7 дней / 14 дней / 1 месяц)
Mailing Datenbank.xlsx — эталон колонок, которые нужно заполнять (можно брать названия столбцов прямо из этого файла).
Колонки выходной таблицы (точно как в файле)
– Datum Scraping
– Veröffentlichungsdatum
– nr. (Referenz-Nr.)
– Position
– Unternehmen
– Straße und Hausnummer
– PLZ, Ort
– Telefon
– Internet (Homepage)
– Ansprechperson (AP)
– E-Mail – AP Firma
– Einsatzort
– Link auf Anzeige
– alle stellen
Если поле отсутствует на странице — ставить empty.
Фильтры (обязательно)
Zeitarbeit = false (ни одной Zeitarbeit в результате)
Externe Stellenbörsen = ausblenden (отсечь внешние биржи)
Veröffentlichungsdatum = последние X дней (по параметру в дашборде, 24h / 7 дней / 14 дней / 1 месяц)
Дедупликация
Первичный ключ: Referenz-Nr. (nr.)
Требования к качеству данных
Адрес разбит: Street / PLZ / Ort
Телефон/Email — чистые значения (без «E+11», без лишних символов)
Job URL — кликабельный URL карточки вакансии (не внутренний ID)
Veröffentlichungsdatum: если «vor X Tagen» — конвертировать в точную дату
Технические требования
Повторный запуск не создает дубликатов.
Дашборд (минимальный)
Поля: ключевое слово, город/радиус, период публикации (24h/7/14/30), чекбоксы фильтры Zeitarbeit/Externe
Кнопка Start → после выполнения дает скачать Excel и — пуш в Google Sheet).
Критерии приемки
Вывод Excel/CSV ровно по структуре «Mailing Datenbank.xlsx» (названия колонок из файла).
Случайная проверка 50 вакансий: адреса разбиты, контакты чистые, Veröffentlichungsdatum — точными датами, URL открываются.
Если данных нет — в соответствующей колонке стоит
empty.README с инструкцией и коротким отчетом (сколько собрано, отсеяно Zeitarbeit/Externe, количество дубликатов, количество 429/5xx, как обрабатывалась капча).
Этапность и тест
Тестовое задание (обязательное): собрать 20 вакансий «Lagermitarbeiter/in» за 7 дней, применив фильтры; отдать Excel/CSV по структуре файла; отсутствующие поля обозначить
empty.Этап 1 (контракт): полный парсер BA + дедупликация + правило
empty+ вывод в Excel/CSV.
Отзыв заказчика о сотрудничестве с Сергеем Андреевым
Парсер заказаХорошая коммуникация, быстро, качественно - рекомендую
Отзыв фрилансера о сотрудничестве с Олександрой Килимник
Парсер заказаМне понравилось сотрудничество, понимание и решение вопросов.
-
2287 25 1 Здравствуйте, разрабатываю на python более 5 лет, буквально недавно закончил проект по парсингу Linkedin, где также есть капча. С сайтом ознакомился, есть вариант с использованием запросов для скорости, а есть с использованием антидетект браузера для надежности, формирование в excel не проблема, можно использовать библиотеку pandas. Также предлагаю интерфейс на flask, при запуске программы будет локальный веб интерфейс, с кнопками, красивым оформлением и логированием для просмотра процесса работы. Буду рад обсудить детали и перейти к сотрудничеству!
-
765 7 0 Я Python-разработчик с опытом 7+ лет. Выглядит понятно. Готов взяться!
-
991 12 1 Готов оперативно и качественно выполнить ваш заказ. Имею опыт работы с аналогичными проектами, всегда соблюдаю дедлайны и техническое задание. Буду рад сотрудничеству!
-
8168 63 1 Добрый день,
Я готов взяться за проект по разработке стабильного парсера вакансий с сайта Bundesagentur für Arbeit. Моё задание будет создать инструмент, который автоматически будет собирать вакансии, применять обязательные фильтры и возвращать структурированную таблицу в соответствии с вашими колонками. Также включу простой дашборд для удобного запуска сбора и получения результатов в формате Excel/CSV/Google Sheet.
Учитывая наличие капчи на BA, реализую соответствующую обработку.
С нетерпением жду возможности попробовать свои силы, мои требования -- 16$ в час. Для начала необходимо подробнее ознакомиться со всеми материалами и заданием.
Артур
-
172 1 1 Добрый день! Готов выполнить этот проект. Большой опыт разработки разнообразных приложений.
-
10130 117 0 Здравствуйте.
Разрабатываю парсеры на NodeJS. Готов взяться. Пишите, обсудим.
-
1512 15 0 1 Добрый день. Посмотрел. Уже есть план реализации - обращайтесь.
Актуальные фриланс-проекты в категории Базы данных и SQL
Вайбкодин через Claude Code
15 533 UAH
Разработать закрытую веб-платформу для корпоративных мероприятий с персональными приглашениями через уникальные ссылки и QR-коды. После сканирования QR-кода пользователь попадает на персональную страницу приглашения с приветственным сообщением, обращением по имени, фото и… AI в дизайне, Базы данных и SQL ∙ 39 минут назад ∙ 15 ставок |
Требуется разработчик для парсинга каталога и автоматизации импорта данныхПодробное ТЗ в прикрепленном документе прошу в отклике указать ориентировочную стоимость и сроки реализации есть ли опыт работы с парсингом крупных каталогов какие возможные сложности или ограничения вы видите в данной задаче Базы данных и SQL, Парсинг данных ∙ 4 часа 31 минута назад ∙ 25 ставок |
Нужен специалист по Power BI для построения управленческой отчетности на базе BAS Бухгалтерия КОРПО компанииМы являемся дистрибьютором международных спортивных брендов в Украине. Учет ведется в BAS Бухгалтерия КОРП.Ищем специалиста, который поможет построить систему управленческой отчетности для руководства компании на базе Power BI.Важно: нас интересует не просто… Базы данных и SQL, Бухгалтерские услуги ∙ 4 дня 4 часа назад ∙ 6 ставок |
Техническое задание: Интеграция чат-бота Telegram с BAS1. Общая информация Необходимо реализовать интеграцию чат-бота с системой BAS для передачи и записи данных о товарах (заказах). 2. Входные данные (что передает чат-бот): ID группы Название товара (с кодом товара) Цена товара 3. Логика работы: При нажатии на кнопку Заказать… Автоматизация управления предприятием, Базы данных и SQL ∙ 4 дня 7 часов назад ∙ 19 ставок |
Розробка аналітичного Power BI дашборду
2000 UAH
Ось такий у нас запит, потрібна людина яка розбирається з Power BI: Экран 1: Strategic Cockpit (Финансовое здоровье завода) Цель: За 5 секунд понять, «где мы теряем деньги и сколько?». KPI Tiles (Верхняя полоса): Общая маржа (Факт vs План) в %. Сумма «упущенной выгоды»… Базы данных и SQL ∙ 7 дней 7 часов назад ∙ 13 ставок |