Парсер публичных данных компаний из 3-х открытых источников
Автоматизированный сбор данных о государственных организациях
Задача:
Разработать инструмент для сбора и структурирования данных о государственных организациях из открытых онлайн-источников с последующим экспортом в удобный Excel-формат.
Источники интеграции:
YouControl (аналитика и досье компаний Украины)
Clarity Project (тендеры и прозрачность госзакупок)
Zakupivli.pro (Prozorro – государственные публичные закупки)
Основные этапы работы:
Поиск и сбор базовых данных
название организации
код ЕДРПОУ
регион
адрес
ответственные лица
Сбор контактной информации
телефоны
email
другие доступные каналы связи
Формирование единой базы данных
унификация полей
очистка и структурирование данных
экспорт в .xlsx (Excel)
Результат:
Клиент получил удобный Excel-файл с полной базой организаций, который можно использовать для аналитики, поиска партнеров, мониторинга или маркетинговых задач.
Технологии:
Python (Requests, BeautifulSoup, Selenium)
pandas, openpyxl
Обработка и нормализация данных
Задача:
Разработать инструмент для сбора и структурирования данных о государственных организациях из открытых онлайн-источников с последующим экспортом в удобный Excel-формат.
Источники интеграции:
YouControl (аналитика и досье компаний Украины)
Clarity Project (тендеры и прозрачность госзакупок)
Zakupivli.pro (Prozorro – государственные публичные закупки)
Основные этапы работы:
Поиск и сбор базовых данных
название организации
код ЕДРПОУ
регион
адрес
ответственные лица
Сбор контактной информации
телефоны
другие доступные каналы связи
Формирование единой базы данных
унификация полей
очистка и структурирование данных
экспорт в .xlsx (Excel)
Результат:
Клиент получил удобный Excel-файл с полной базой организаций, который можно использовать для аналитики, поиска партнеров, мониторинга или маркетинговых задач.
Технологии:
Python (Requests, BeautifulSoup, Selenium)
pandas, openpyxl
Обработка и нормализация данных