Цифровой соучредитель.
Мета: Создать интеллектуального AI-партнера для владельца строительной девелоперской компании. Система должна объединить офлайн-базу знаний (Obsidian) с мощностью облачного AI (OpenAI GPT-4o). Ключевые требования:
- RAG (Retrieval-Augmented Generation): Ответы должны основываться исключительно на внутренних регламентах и документах компании.
- Двусторонняя связь: Агент должен не только "читать" базу, но и "писать" в нее (создавать новые файлы/регламенты по команде в Telegram).
- Экономия ресурсов: Умная индексация, чтобы не перечитывать неизмененные файлы.
Мой Вклад / Решение:
Решение построено на базе Self-hosted n8n (Railway), векторной базы данных Supabase и облачного хранилища Google Drive. Архитектура состоит из 3-х сложных воркфлоу:
1. Воркфлоу "Умный Индексатор" (ETL Pipeline):
Google Drive (Рекурсивный Поиск): Реализован сложный алгоритм поиска файлов (.md, .txt, .pdf) по всему диску с обходом вложенных папок и фильтрацией "чужих" файлов.
Incremental Sync (Экономия средств): Разработана логика сравнения метаданных. Воркфлоу сравнивает файлы с диска с таблицей file_tracker в Supabase (SQL). На обработку (Embedding) отправляются только новые или измененные файлы. Это экономит до 90% токенов OpenAI.
Векторизация: Текст разбивается на чанки, преобразуется в векторы (OpenAI Embeddings) и сохраняется в Supabase.
2. Воркфлоу "Мозг" (Conversational AI Agent):
AI Агент (LangChain): Использует модель GPT-4o с кастомным системным промптом "Цифрового Соучредителя".
Долгосрочная Память: Подключена Postgres Chat Memory (в Supabase), что позволяет боту помнить контекст диалогов бессрочно.
Инструмент Векторного Хранения: Реализован инструмент поиска, который использует кастомную SQL-функцию match_documents для нахождения наиболее релевантных ответов в базе знаний.
3. Воркфлоу "Руки" (File Generator Tool):
Автономное создание контента: Агент может вызывать этот саб-воркфлоу для создания новых документов.
Умный Парсинг (JavaScript): Написан скрипт-санитайзер, который разбирает ответ AI (даже если он приходит в нестандартном формате) на filename и content.
Запись: Файл загружается на Google Drive, после чего автоматически синхронизируется с локальным Obsidian заказчика через Google Drive Desktop.
Результат:
Клиент получил полностью автономную систему управления знаниями:
"Живая" База: Любое изменение в заметке Obsidian автоматически попадает в "мозг" бота.
Стратегический партнер: Владельцу можно консультироваться с ботом по стратегии, и бот отвечает, опираясь на историю и контекст компании, а не на общие фразы.
Автоматизация рутины: Бот работает как секретарь — создает черновики договоров, идей и планов прямо в рабочую папку владельца.
Надежность: Решены проблемы с тайм-аутами серверов и дубликатами данных с помощью SQL-оптимизации и настроек Railway.
#n8n #OpenAI #RAG #Supabase #VectorDatabase #PostgreSQL #Obsidian #KnowledgeManagement #WorkflowAutomation #JavaScript #Railway #SelfHosted #GoogleDriveAPI #AIagent
- RAG (Retrieval-Augmented Generation): Ответы должны основываться исключительно на внутренних регламентах и документах компании.
- Двусторонняя связь: Агент должен не только "читать" базу, но и "писать" в нее (создавать новые файлы/регламенты по команде в Telegram).
- Экономия ресурсов: Умная индексация, чтобы не перечитывать неизмененные файлы.
Мой Вклад / Решение:
Решение построено на базе Self-hosted n8n (Railway), векторной базы данных Supabase и облачного хранилища Google Drive. Архитектура состоит из 3-х сложных воркфлоу:
1. Воркфлоу "Умный Индексатор" (ETL Pipeline):
Google Drive (Рекурсивный Поиск): Реализован сложный алгоритм поиска файлов (.md, .txt, .pdf) по всему диску с обходом вложенных папок и фильтрацией "чужих" файлов.
Incremental Sync (Экономия средств): Разработана логика сравнения метаданных. Воркфлоу сравнивает файлы с диска с таблицей file_tracker в Supabase (SQL). На обработку (Embedding) отправляются только новые или измененные файлы. Это экономит до 90% токенов OpenAI.
Векторизация: Текст разбивается на чанки, преобразуется в векторы (OpenAI Embeddings) и сохраняется в Supabase.
2. Воркфлоу "Мозг" (Conversational AI Agent):
AI Агент (LangChain): Использует модель GPT-4o с кастомным системным промптом "Цифрового Соучредителя".
Долгосрочная Память: Подключена Postgres Chat Memory (в Supabase), что позволяет боту помнить контекст диалогов бессрочно.
Инструмент Векторного Хранения: Реализован инструмент поиска, который использует кастомную SQL-функцию match_documents для нахождения наиболее релевантных ответов в базе знаний.
3. Воркфлоу "Руки" (File Generator Tool):
Автономное создание контента: Агент может вызывать этот саб-воркфлоу для создания новых документов.
Умный Парсинг (JavaScript): Написан скрипт-санитайзер, который разбирает ответ AI (даже если он приходит в нестандартном формате) на filename и content.
Запись: Файл загружается на Google Drive, после чего автоматически синхронизируется с локальным Obsidian заказчика через Google Drive Desktop.
Результат:
Клиент получил полностью автономную систему управления знаниями:
"Живая" База: Любое изменение в заметке Obsidian автоматически попадает в "мозг" бота.
Стратегический партнер: Владельцу можно консультироваться с ботом по стратегии, и бот отвечает, опираясь на историю и контекст компании, а не на общие фразы.
Автоматизация рутины: Бот работает как секретарь — создает черновики договоров, идей и планов прямо в рабочую папку владельца.
Надежность: Решены проблемы с тайм-аутами серверов и дубликатами данных с помощью SQL-оптимизации и настроек Railway.
#n8n #OpenAI #RAG #Supabase #VectorDatabase #PostgreSQL #Obsidian #KnowledgeManagement #WorkflowAutomation #JavaScript #Railway #SelfHosted #GoogleDriveAPI #AIagent