Обработка PDF с использованием ИИ для контрактов UPS и FDX
Я возглавил разработку приложения для обработки PDF с использованием ИИ в качестве доказательства концепции (POC) для клиента, сосредоточившись на сложной задаче извлечения и обработки данных из контрактов UPS и FDX. Этот проект объединил передовые технологии OCR, современные методы майнинга PDF и последние достижения в инженерии подсказок LLM для предоставления комплексного решения.
Ключевые вклады:
- Продвинутый OCR и майнинг PDF: Использовал комбинацию инструментов OCR и специализированных майнеров PDF, таких как Camelot и PuMuPDF, для точного извлечения данных из сложных структурированных документов.
- Инженерия подсказок LLM: Реализовал и настроил техники инженерии подсказок для повышения точности и актуальности извлеченной информации.
- Интеграция Streamlit: Разработал дешевый и интуитивно понятный пользовательский интерфейс с использованием Streamlit, обеспечивая бесшовное взаимодействие с ИИ моделями и легкий доступ к обзору извлеченных данных.
- Сотрудничество с клиентом: Тесно взаимодействовал с клиентом для сбора подробных требований, обеспечивая соответствие решения их специфической бизнес-логике и операционным потребностям.
- Комплексная отчетность: Предоставил 40-страничный отчет по науке о данных, в котором подробно описаны методологии, результаты, анализ затрат и рекомендации, предоставляя клиенту глубокие инсайты в обработку их контрактов.
Ключевые вклады:
- Продвинутый OCR и майнинг PDF: Использовал комбинацию инструментов OCR и специализированных майнеров PDF, таких как Camelot и PuMuPDF, для точного извлечения данных из сложных структурированных документов.
- Инженерия подсказок LLM: Реализовал и настроил техники инженерии подсказок для повышения точности и актуальности извлеченной информации.
- Интеграция Streamlit: Разработал дешевый и интуитивно понятный пользовательский интерфейс с использованием Streamlit, обеспечивая бесшовное взаимодействие с ИИ моделями и легкий доступ к обзору извлеченных данных.
- Сотрудничество с клиентом: Тесно взаимодействовал с клиентом для сбора подробных требований, обеспечивая соответствие решения их специфической бизнес-логике и операционным потребностям.
- Комплексная отчетность: Предоставил 40-страничный отчет по науке о данных, в котором подробно описаны методологии, результаты, анализ затрат и рекомендации, предоставляя клиенту глубокие инсайты в обработку их контрактов.