Система семантичного пошуку та генерації звітів (RAG)
Система аналітики неструктурованих даних (текст та медіа), яка реалізує підхід RAG для забезпечення семантичного пошуку та створення структурованих звітів на основі фільтрованих результатів. Інтерфейс дозволяє користувачам здійснювати глибокий пошук по базі текстових документів, зображень, відео та аудіо з урахуванням різних фільтрів: тип даних, діапазон дат, метадані.
Після пошуку користувач має можливість створювати кастомізовані аналітичні звіти, згенеровані за допомогою LLM моделей (в т.ч. локальних або API) на основі відібраного контенту.
Ключові функціональні можливості:
* Семантичний пошук за допомогою RAG (поєднання векторного пошуку та генерації відповідей),
* Інтегровані фільтри для уточнення результатів (тип, дата, метадані, релевантність),
* Підтримка декількох типів контенту: документи, аудіо, відео, зображення,
* Генерація звітів локальними LLM-моделями для обробки приватних даних.
Технологічний стек:
* Python — основна логіка, обробка даних, інтеграція з LLM,
* Elasticsearch — зберігання та семантичний пошук векторизованих даних,
* OpenAI — використання моделей GPT для побудови RAG-пайплайнів,
* Docker, Git, Linux — платформа, деплоймент, CI/CD.
Моя роль:
Архітектура системи, реалізація механізму індексації та семантичного пошуку, інтеграція OpenAI API та локальні LLM, налаштування середовища розгортання з використанням Docker, автоматизація створення звітів.
#python #elasticsearch #openai #llama #docker #git
Після пошуку користувач має можливість створювати кастомізовані аналітичні звіти, згенеровані за допомогою LLM моделей (в т.ч. локальних або API) на основі відібраного контенту.
Ключові функціональні можливості:
* Семантичний пошук за допомогою RAG (поєднання векторного пошуку та генерації відповідей),
* Інтегровані фільтри для уточнення результатів (тип, дата, метадані, релевантність),
* Підтримка декількох типів контенту: документи, аудіо, відео, зображення,
* Генерація звітів локальними LLM-моделями для обробки приватних даних.
Технологічний стек:
* Python — основна логіка, обробка даних, інтеграція з LLM,
* Elasticsearch — зберігання та семантичний пошук векторизованих даних,
* OpenAI — використання моделей GPT для побудови RAG-пайплайнів,
* Docker, Git, Linux — платформа, деплоймент, CI/CD.
Моя роль:
Архітектура системи, реалізація механізму індексації та семантичного пошуку, інтеграція OpenAI API та локальні LLM, налаштування середовища розгортання з використанням Docker, автоматизація створення звітів.
#python #elasticsearch #openai #llama #docker #git