Парсер замовлення
7500 UAHШукаю розробника Python для створення стабільного парсера вакансій із сайту Bundesagentur für Arbeit (https://www.arbeitsagentur.de/jobsuche/.
Фінальний інструмент має збирати вакансії зі списку та jobdetail-сторінок, застосовувати обов’язкові фільтри й повертати структуровану таблицю під мої колонки.
У проєкті передбачено простий дашборд (веб-інтерфейс), щоб я міг сам запускати збір (ключове слово, місто/радіус, період публікації), натиснути «Старт» і отримати готовий Excel/CSV/Google Sheet.
Важливо: на BA є капча (hCaptcha).
Матеріали, які я прикріплю до проєкту
Job Page.png — показує, де саме брати: Position, Unternehmen, Straße und Hausnummer, PLZ/Ort, Ansprechperson (AP), Telefon, E-Mail, Homepage, Veröffentlichungsdatum, Referenz-Nr. (nr.), Einsatzort, Link auf Anzeige.
Filters BA.png — показує, які фільтри обов’язково вмикати перед парсингом:
Zeitarbeit ausschließen (виключити)
Externe Stellenbörsen ausschließen (виключити)
Veröffentlichungsdatum (період: 24h / 7 днів / 14 днів / 1 місяць)
Mailing Datenbank.xlsx — еталон коло́нок, які треба заповнювати (можна брати назви стовпців прямо з цього файлу).
Колонки вихідної таблиці (точно як у файлі)
– Datum Scraping
– Veröffentlichungsdatum
– nr. (Referenz-Nr.)
– Position
– Unternehmen
– Straße und Hausnummer
– PLZ, Ort
– Telefon
– Internet (Homepage)
– Ansprechperson (AP)
– E-Mail – AP Firma
– Einsatzort
– Link auf Anzeige
– alle stellen
Якщо поле відсутнє на сторінці — ставити empty.
Фільтри (обов’язково)
Zeitarbeit = false (жодної Zeitarbeit у результаті)
Externe Stellenbörsen = ausblenden (відсікти зовнішні біржі)
Veröffentlichungsdatum = останні X днів (за параметром у дашборді, 24h / 7 днів / 14 днів / 1 місяць)
Дедуплікація
Первинний ключ: Referenz-Nr. (nr.)
Вимоги до якості даних
Адреса розбита: Street / PLZ / Ort
Телефон/Email — чисті значення (без «E+11», без зайвих символів)
Job URL — клікабельний URL картки вакансії (не внутрішній ID)
Veröffentlichungsdatum: якщо «vor X Tagen» — конвертувати у точну дату
Технічні вимоги
Повторний запуск не створює дублікатів.
Дашборд (мінімальний)
Поля: ключове слово, місто/радіус, період публікації (24h/7/14/30), чекбокси фільтри Zeitarbeit/Externe
Кнопка Start → після виконання дає скачати Excel та — пуш у Google Sheet).
Критерії приймання
Вивід Excel/CSV рівно за структурою «Mailing Datenbank.xlsx» (назви колонок з файлу).
Випадкова перевірка 50 вакансій: адреси розбиті, контакти чисті, Veröffentlichungsdatum — точними датами, URL відкриваються.
Якщо даних немає — у відповідній колонці стоїть
empty.README з інструкцією та коротким звітом (скільки зібрано, відсіяно Zeitarbeit/Externe, кількість дублікатів, кількість 429/5xx, як оброблялась капча).
Етапність і тест
Тестове завдання (обов’язкове): зібрати 20 вакансій «Lagermitarbeiter/in» за 7 днів, застосувавши фільтри; віддати Excel/CSV за структурою файлу; відсутні поля позначити
empty.Етап 1 (контракт): повний парсер BA + дедуплікація + правило
empty+ вивід у Excel/CSV.
Відгук замовника про співпрацю з Сергеєм Андреевим
Парсер замовленняГарна комунікація, швидко, якісно - рекомендую
Відгук фрилансера про співпрацю з Олександрою Килимник
Парсер замовленняСподобалась співпраця, розуміння і вирішення питань.
-
2283 25 1 Вітаю, розробляю на python більше 5 років, буквально нещодавно закінчив проект з парсингу Linkedin де також є капча. З сайтом ознайомився, є варіант з використанням запитів для швидкості, а є з використання антидетект браузера для надійності, формування в excel не проблема, можна використати бібліотеку pandas. Також пропоную інтерфейс на flask, при запуску програми буде локальний веб інтерфейс, з кнопками, красивим оформленням та логування для перегляду процесу роботи. Буду радий обговорити деталі та перейти до співпраці!
-
765 7 0 Я Python-розробник з досвідом 7+ років. Виглядає зрозуміло. готовий взятись!
-
991 12 1 Готовий оперативно та якісно виконати ваше замовлення. Маю досвід роботи з аналогічними проєктами, завжди дотримуюсь дедлайнів і технічного завдання. Буду радий співпраці!
-
8193 63 1 Добрий день,
Я готов взятися за проект з розробки стабільного парсера вакансій із сайту Bundesagentur für Arbeit. Моє завдання буде створити інструмент, який автоматично збиратиме вакансії, застосовуватиме обов’язкові фільтри та повертатиме структуровану таблицю відповідно до ваших колонок. Також включу простий дашборд для зручного запуску збору та отримання результатів у форматі Excel/CSV/Google Sheet.
Ураховуючи наявність капчі на BA, реалізуватиму відповідну обробку.
З нетерпінням чекаю можливості спробувати свої сили, мої вимоги -- 16$ на годину. Для початку необхідно докладніше ознайомитися з усіма матеріалами та завданням.
… Артур
-
172 1 1 Доброго дня!Готов виконати цей проект. Великий досвiд розробки рiзноманiтних додаткiв
-
10123 117 0 Вітаю.
Розробляю парсери на NodeJS. Готовий взятися. Пишіть, обговоримо.
-
1512 15 0 1 Доброго дня. Подивився. Вже маю план реалізаціі - звертайтеся
Актуальні фриланс-проєкти в категорії Бази даних та SQL
Система обліку, планування та продажу для грибної ферми
27 000 UAH
Ось повний, фінальний текст Технічного завдання (ТЗ). Він об'єднує всі ваші вимоги: 16 камер, 20 контрагентів, розклад по днях, облік тари, розрахунок рентабельності та обов'язковий поділ на три сорти грибів. Ви можете повністю скопіювати цей текст і надсилати розробникам або… Бази даних та SQL, Управління клієнтами та CRM ∙ 16 годин 17 хвилин тому ∙ 44 ставки |
Зовнішній звіт 1С 8.3 — прогноз залишків товарів
1000 UAH
Потрібен зовнішній звіт (.erf) для 1С:Підприємство 8.3 (конфігурація уточнюється). Що має робити: Витягувати залишки товарів з бази Аналізувати історію продажів за останні 30 днів Рахувати середній темп продажів по кожному товару Визначати через скільки днів товар закінчиться… Бази даних та SQL, Управління клієнтами та CRM ∙ 16 годин 52 хвилини тому ∙ 10 ставок |
Аудит безпеки веб-додатків та бази даних для кастомного CRM — спеціаліст з BaaS / бази даних як API (пенетраціяОгляд проекту Ми експлуатуємо спеціально розроблену платформу управління взаємовідносинами з клієнтами (CRM), яка обслуговує два сервісні бізнеси на єдиній системі. Це сучасний веб-додаток на JavaScript, підтримуваний базою даних як послугою (BaaS) і розгорнутий на безсерверній… Бази даних та SQL, Тестування та QA ∙ 1 день 5 годин тому ∙ 9 ставок |
Синхронізація баз данихСинхронізація програм Microsoft Access та CRM SalesDrive. Передача даних з CRM в Microsoft Access на першому етапі (зміна статусу воронки). Передача даних з Microsoft Access в CRM на другому етапі (зміна статусу в програмі). Бази даних та SQL ∙ 1 день 11 годин тому ∙ 10 ставок |
Налаштування системи резервного копіювання та оптимізація серверної інфраструктуриМета робіт:Забезпечити надійне збереження даних CRM-системи та додатку шляхом впровадження автоматизованої системи резервного копіювання (Backups), а також провести ряд серверних доробок для підвищення стабільності, безпеки та продуктивності інфраструктури. DevOps, Бази даних та SQL ∙ 2 дні 9 годин тому ∙ 23 ставки |