Умный парсер PDF в Excel и инструмент веб-автоматизации
Разработал комплексное решение на базе Python для автоматизации рутинных задач по обработке технической документации и взаимодействию с веб-ресурсами. Программа позволяет преобразовать часы ручной проверки каталогов в считанные секунды автоматизированной работы.
Ключевой функционал:
Интеллектуальный парсинг (PDF Extraction): Автоматическое сканирование сложных PDF-файлов, извлечение артикулов (NSN) и соответствующих описаний товаров.
Генерация Smart-Excel: Создание структурированных таблиц с встроенными гиперссылками для мгновенного перехода к форме запроса.
Web Automation (Playwright): Полная автоматизация взаимодействия с сайтом — скрипт самостоятельно открывает браузер и заполняет необходимые формы, исключая человеческий фактор и ошибки.
Графический интерфейс (GUI): Разработано удобное окно управления на Tkinter с прогресс-баром для мониторинга статуса обработки в реальном времени.
Технологический стек:
Язык: Python
Библиотеки: Playwright (автоматизация браузера), Pandas (работа с данными), pdfplumber (парсинг текста), Tkinter (интерфейс).
Ключевой функционал:
Интеллектуальный парсинг (PDF Extraction): Автоматическое сканирование сложных PDF-файлов, извлечение артикулов (NSN) и соответствующих описаний товаров.
Генерация Smart-Excel: Создание структурированных таблиц с встроенными гиперссылками для мгновенного перехода к форме запроса.
Web Automation (Playwright): Полная автоматизация взаимодействия с сайтом — скрипт самостоятельно открывает браузер и заполняет необходимые формы, исключая человеческий фактор и ошибки.
Графический интерфейс (GUI): Разработано удобное окно управления на Tkinter с прогресс-баром для мониторинга статуса обработки в реальном времени.
Технологический стек:
Язык: Python
Библиотеки: Playwright (автоматизация браузера), Pandas (работа с данными), pdfplumber (парсинг текста), Tkinter (интерфейс).