Парсер публічних даних компаній з 3х відкритих джерел
Автоматизований збір даних про організації державного сектору
Задача:
Розробити інструмент для збору та структурування даних про державні організації з відкритих онлайн-джерел, з подальшим експортом у зручний Excel-формат.
Джерела інтеграції:
YouControl (аналітика та досьє компаній України)
Clarity Project (тендери та прозорість держзакупівель)
Zakupivli.pro (Prozorro – державні публічні закупівлі)
Основні етапи роботи:
Пошук та збір базових даних
назва організації
код ЄДРПОУ
регіон
адреса
відповідальні особи
Збір контактної інформації
телефони
email
інші доступні канали зв’язку
Формування єдиної бази даних
уніфікація полів
очищення та структурування даних
експорт у .xlsx (Excel)
Результат:
Клієнт отримав зручний Excel-файл з повною базою організацій, який можна використовувати для аналітики, пошуку партнерів, моніторингу чи маркетингових завдань.
Технології:
Python (Requests, BeautifulSoup, Selenium)
pandas, openpyxl
Обробка та нормалізація даних
Задача:
Розробити інструмент для збору та структурування даних про державні організації з відкритих онлайн-джерел, з подальшим експортом у зручний Excel-формат.
Джерела інтеграції:
YouControl (аналітика та досьє компаній України)
Clarity Project (тендери та прозорість держзакупівель)
Zakupivli.pro (Prozorro – державні публічні закупівлі)
Основні етапи роботи:
Пошук та збір базових даних
назва організації
код ЄДРПОУ
регіон
адреса
відповідальні особи
Збір контактної інформації
телефони
інші доступні канали зв’язку
Формування єдиної бази даних
уніфікація полів
очищення та структурування даних
експорт у .xlsx (Excel)
Результат:
Клієнт отримав зручний Excel-файл з повною базою організацій, який можна використовувати для аналітики, пошуку партнерів, моніторингу чи маркетингових завдань.
Технології:
Python (Requests, BeautifulSoup, Selenium)
pandas, openpyxl
Обробка та нормалізація даних