Cyfrowy współzałożyciel.
Cel: Stworzenie inteligentnego partnera AI dla właściciela firmy budowlano-deweloperskiej. System miał połączyć offline'ową bazę wiedzy (Obsidian) z mocą chmurowego AI (OpenAI GPT-4o). Kluczowe wymagania:
- RAG (Retrieval-Augmented Generation): Odpowiedzi mają opierać się wyłącznie na wewnętrznych regulaminach i dokumentach firmy.
- Dwustronna komunikacja: Agent musi nie tylko "czytać" bazę, ale także "pisać" do niej (tworzyć nowe pliki/regulaminy na polecenie w Telegramie).
- Oszczędność zasobów: Inteligentna indeksacja, aby nie przeszukiwać niezmienionych plików.
Mój wkład / rozwiązanie:
Rozwiązanie zbudowane na bazie Self-hosted n8n (Railway), wektorowej bazy danych Supabase oraz chmurowego magazynu Google Drive. Architektura składa się z 3 złożonych workflow:
1. Workflow "Inteligentny Indeksator" (ETL Pipeline):
Google Drive (Rekurencyjne wyszukiwanie): Zrealizowano złożony algorytm wyszukiwania plików (.md, .txt, .pdf) na całym dysku z przeszukiwaniem zagnieżdżonych folderów oraz filtrowaniem "obcych" plików.
Synchronizacja inkrementalna (Oszczędność kosztów): Opracowano logikę porównywania metadanych. Workflow porównuje pliki z dysku z tabelą file_tracker w Supabase (SQL). Do przetwarzania (Embedding) wysyłane są tylko nowe lub zmienione pliki. To oszczędza do 90% tokenów OpenAI.
Wektoryzacja: Tekst dzielony jest na kawałki, przekształcany w wektory (OpenAI Embeddings) i przechowywany w Supabase.
2. Workflow "Mózg" (Agenta AI):
Agent AI (LangChain): Wykorzystuje model GPT-4o z niestandardowym systemowym promptem "Cyfrowego Współzałożyciela".
Pamięć długoterminowa: Podłączono Postgres Chat Memory (w Supabase), co pozwala botowi pamiętać kontekst dialogów bezterminowo.
Narzędzie przechowywania wektorów: Zrealizowano narzędzie wyszukiwania, które wykorzystuje niestandardową funkcję SQL match_documents do znajdowania najbardziej odpowiednich odpowiedzi w bazie wiedzy.
3. Workflow "Ręce" (Narzędzie Generowania Plików):
Autonomiczne tworzenie treści: Agent może wywołać ten sub-workflow do tworzenia nowych dokumentów.
Inteligentne parsowanie (JavaScript): Napisano skrypt-sanitizer, który analizuje odpowiedź AI (nawet jeśli przychodzi w niestandardowym formacie) na filename i content.
Zapis: Plik jest przesyłany na Google Drive, po czym automatycznie synchronizuje się z lokalnym Obsidianem klienta przez Google Drive Desktop.
Wynik:
Klient otrzymał w pełni autonomiczny system zarządzania wiedzą:
"Żywa" Baza: Każda zmiana w notatce Obsidian automatycznie trafia do "mózgu" bota.
Strategiczny partner: Właściciel może konsultować się z botem w sprawie strategii, a bot odpowiada, opierając się na historii i kontekście firmy, a nie na ogólnych frazach.
Automatyzacja rutyny: Bot działa jak sekretarz — tworzy szkice umów, pomysłów i planów bezpośrednio w roboczym folderze właściciela.
Niezawodność: Rozwiązano problemy z czasem oczekiwania serwerów oraz duplikatami danych dzięki optymalizacji SQL i ustawieniom Railway.
#n8n #OpenAI #RAG #Supabase #VectorDatabase #PostgreSQL #Obsidian #KnowledgeManagement #WorkflowAutomation #JavaScript #Railway #SelfHosted #GoogleDriveAPI #AIagent
- RAG (Retrieval-Augmented Generation): Odpowiedzi mają opierać się wyłącznie na wewnętrznych regulaminach i dokumentach firmy.
- Dwustronna komunikacja: Agent musi nie tylko "czytać" bazę, ale także "pisać" do niej (tworzyć nowe pliki/regulaminy na polecenie w Telegramie).
- Oszczędność zasobów: Inteligentna indeksacja, aby nie przeszukiwać niezmienionych plików.
Mój wkład / rozwiązanie:
Rozwiązanie zbudowane na bazie Self-hosted n8n (Railway), wektorowej bazy danych Supabase oraz chmurowego magazynu Google Drive. Architektura składa się z 3 złożonych workflow:
1. Workflow "Inteligentny Indeksator" (ETL Pipeline):
Google Drive (Rekurencyjne wyszukiwanie): Zrealizowano złożony algorytm wyszukiwania plików (.md, .txt, .pdf) na całym dysku z przeszukiwaniem zagnieżdżonych folderów oraz filtrowaniem "obcych" plików.
Synchronizacja inkrementalna (Oszczędność kosztów): Opracowano logikę porównywania metadanych. Workflow porównuje pliki z dysku z tabelą file_tracker w Supabase (SQL). Do przetwarzania (Embedding) wysyłane są tylko nowe lub zmienione pliki. To oszczędza do 90% tokenów OpenAI.
Wektoryzacja: Tekst dzielony jest na kawałki, przekształcany w wektory (OpenAI Embeddings) i przechowywany w Supabase.
2. Workflow "Mózg" (Agenta AI):
Agent AI (LangChain): Wykorzystuje model GPT-4o z niestandardowym systemowym promptem "Cyfrowego Współzałożyciela".
Pamięć długoterminowa: Podłączono Postgres Chat Memory (w Supabase), co pozwala botowi pamiętać kontekst dialogów bezterminowo.
Narzędzie przechowywania wektorów: Zrealizowano narzędzie wyszukiwania, które wykorzystuje niestandardową funkcję SQL match_documents do znajdowania najbardziej odpowiednich odpowiedzi w bazie wiedzy.
3. Workflow "Ręce" (Narzędzie Generowania Plików):
Autonomiczne tworzenie treści: Agent może wywołać ten sub-workflow do tworzenia nowych dokumentów.
Inteligentne parsowanie (JavaScript): Napisano skrypt-sanitizer, który analizuje odpowiedź AI (nawet jeśli przychodzi w niestandardowym formacie) na filename i content.
Zapis: Plik jest przesyłany na Google Drive, po czym automatycznie synchronizuje się z lokalnym Obsidianem klienta przez Google Drive Desktop.
Wynik:
Klient otrzymał w pełni autonomiczny system zarządzania wiedzą:
"Żywa" Baza: Każda zmiana w notatce Obsidian automatycznie trafia do "mózgu" bota.
Strategiczny partner: Właściciel może konsultować się z botem w sprawie strategii, a bot odpowiada, opierając się na historii i kontekście firmy, a nie na ogólnych frazach.
Automatyzacja rutyny: Bot działa jak sekretarz — tworzy szkice umów, pomysłów i planów bezpośrednio w roboczym folderze właściciela.
Niezawodność: Rozwiązano problemy z czasem oczekiwania serwerów oraz duplikatami danych dzięki optymalizacji SQL i ustawieniom Railway.
#n8n #OpenAI #RAG #Supabase #VectorDatabase #PostgreSQL #Obsidian #KnowledgeManagement #WorkflowAutomation #JavaScript #Railway #SelfHosted #GoogleDriveAPI #AIagent