Agent Sprzedaży AI przez Głos, Czat, Telegram, WhatsApp (Jedna Rura)
Sytuacja
Agencja sprzedaży B2B prowadziła kwalifikację leadów w dużej skali dla swoich klientów. Potencjalni klienci kontaktowali się przez 4 kanały: widget na stronie internetowej, rozmowy telefoniczne, Telegram i WhatsApp. Agencja chciała zautomatyzować pierwsze rozmowy kontaktowe we wszystkich tych kanałach bez zatrudniania dodatkowych SDR-ów.
Problem
Większość narzędzi do automatyzacji sprzedaży jest specyficzna dla kanału. Chatbot dla strony internetowej. Oddzielny bot Telegram. Inny dostawca dla głosu. Każde narzędzie ma swoje własne rekordy leadów, swoje własne skrypty, brak wspólnej inteligencji. Kiedy ten sam potencjalny klient skontaktował się przez Telegram, a później zadzwonił na główny numer, nikt nie połączył tych dwóch interakcji. Wyniki leadów były fragmentaryczne. Odpowiedzi w bazie wiedzy były niespójne w różnych kanałach. A rozmowy wychodzące nadal wymagały ludzkiego SDR-a dzwoniącego przez arkusz kalkulacyjny.
Agencja potrzebowała jednego mózgu za każdym kanałem, a nie czterech połączonych narzędzi.
Rozwiązanie
Zbudowałem zintegrowaną platformę sprzedażową, w której każda wiadomość przepływa przez tego samego agenta AI. Głos, czat, Telegram, WhatsApp: każdy kanał ma cienki adapter, który normalizuje przychodzące wiadomości, a następnie przekazuje je do wspólnej ChatService. Ta usługa wyszukuje lead, pobiera odpowiednią wiedzę za pomocą RAG (osadzenia Voyage AI w pgvector) i przekazuje historię rozmowy agentowi, który odpowiada na pytania oparte na rzeczywistych dokumentach produktowych firmy, cenach i FAQ. Te same rekordy leadów, ta sama baza wiedzy, te same wyniki we wszystkich 4 kanałach.
W przypadku rozmów wychodzących operatorzy przesyłają listę kontaktów, dołączają skrypt głosowy i uruchamiają kampanię z panelu administracyjnego. Pracownicy BullMQ dzwonią do kontaktów przez Retell AI z ograniczoną prędkością 1 połączenie/sekundę. Retell obsługuje telekomunikację i mowę; mój niestandardowy punkt końcowy WebSocket przesyła transkrypcję każdego połączenia do agenta w czasie rzeczywistym. Po każdym połączeniu webhooks Retell dostarczają transkrypcję, podsumowanie rozmowy i analizę sentymentu z powrotem do platformy, która automatycznie dostosowuje wyniki leadów (+10 za pozytywny sentyment, -5 za negatywny).
Osadzany widget to 53KB jednofileowy pakiet Vite IIFE, który można umieścić na dowolnej stronie internetowej za pomocą jednego tagu skryptu, renderuje się wewnątrz Shadow DOM, aby uniknąć konfliktów CSS, i przywraca historię czatu po przeładowaniu strony za pomocą localStorage.
Stos technologiczny: NestJS, TypeScript, Claude API (Anthropic SDK), Retell AI, osadzenia Voyage AI, OpenAI Whisper, Supabase (PostgreSQL + pgvector), BullMQ, Redis, Next.js, Vite, Docker, nginx, Cloudflare Tunnel
Wyniki
- 4 kanały zintegrowane w 1 pipeline AI: rozmowy głosowe, czat na stronie, Telegram, WhatsApp dzielą rekordy leadów, bazę wiedzy i wyniki
- Rozmowy wychodzące w pełni zautomatyzowane: operatorzy konfigurują kampanię raz, system dzwoni, prowadzi rozmowy, transkrybuje i ocenia każdy kontakt bez udziału SDR-a
- Gotowe do wieloosobowego użytkowania: organizacje, RBAC i bazy wiedzy dla każdej organizacji wbudowane, dzięki czemu platforma może obsługiwać wielu klientów agencji
- W fazie testów z partnerami z 7 usługami Docker, podpisaną weryfikacją webhooków i pokryciem testów w 34 plikach testowych (jednostkowe, integracyjne, zachowanie AI, E2E)
Jak to działa
1. Potencjalny klient kontaktuje się przez jeden z 4 kanałów (widget, telefon, Telegram, WhatsApp)
2. Adapter kanału normalizuje wiadomość i tworzy lub wyszukuje lead
3. ChatService pobiera historię rozmowy i przeprowadza wyszukiwanie semantyczne w bazie wiedzy firmy
4. Agent generuje odpowiedź opartą na pobranych dokumentach
5. Odpowiedź wraca przez ten sam adapter kanału
6. Wynik leadu aktualizuje się na podstawie sygnałów wiadomości lub (w przypadku głosu) analizy sentymentu po rozmowie
Agencja sprzedaży B2B prowadziła kwalifikację leadów w dużej skali dla swoich klientów. Potencjalni klienci kontaktowali się przez 4 kanały: widget na stronie internetowej, rozmowy telefoniczne, Telegram i WhatsApp. Agencja chciała zautomatyzować pierwsze rozmowy kontaktowe we wszystkich tych kanałach bez zatrudniania dodatkowych SDR-ów.
Problem
Większość narzędzi do automatyzacji sprzedaży jest specyficzna dla kanału. Chatbot dla strony internetowej. Oddzielny bot Telegram. Inny dostawca dla głosu. Każde narzędzie ma swoje własne rekordy leadów, swoje własne skrypty, brak wspólnej inteligencji. Kiedy ten sam potencjalny klient skontaktował się przez Telegram, a później zadzwonił na główny numer, nikt nie połączył tych dwóch interakcji. Wyniki leadów były fragmentaryczne. Odpowiedzi w bazie wiedzy były niespójne w różnych kanałach. A rozmowy wychodzące nadal wymagały ludzkiego SDR-a dzwoniącego przez arkusz kalkulacyjny.
Agencja potrzebowała jednego mózgu za każdym kanałem, a nie czterech połączonych narzędzi.
Rozwiązanie
Zbudowałem zintegrowaną platformę sprzedażową, w której każda wiadomość przepływa przez tego samego agenta AI. Głos, czat, Telegram, WhatsApp: każdy kanał ma cienki adapter, który normalizuje przychodzące wiadomości, a następnie przekazuje je do wspólnej ChatService. Ta usługa wyszukuje lead, pobiera odpowiednią wiedzę za pomocą RAG (osadzenia Voyage AI w pgvector) i przekazuje historię rozmowy agentowi, który odpowiada na pytania oparte na rzeczywistych dokumentach produktowych firmy, cenach i FAQ. Te same rekordy leadów, ta sama baza wiedzy, te same wyniki we wszystkich 4 kanałach.
W przypadku rozmów wychodzących operatorzy przesyłają listę kontaktów, dołączają skrypt głosowy i uruchamiają kampanię z panelu administracyjnego. Pracownicy BullMQ dzwonią do kontaktów przez Retell AI z ograniczoną prędkością 1 połączenie/sekundę. Retell obsługuje telekomunikację i mowę; mój niestandardowy punkt końcowy WebSocket przesyła transkrypcję każdego połączenia do agenta w czasie rzeczywistym. Po każdym połączeniu webhooks Retell dostarczają transkrypcję, podsumowanie rozmowy i analizę sentymentu z powrotem do platformy, która automatycznie dostosowuje wyniki leadów (+10 za pozytywny sentyment, -5 za negatywny).
Osadzany widget to 53KB jednofileowy pakiet Vite IIFE, który można umieścić na dowolnej stronie internetowej za pomocą jednego tagu skryptu, renderuje się wewnątrz Shadow DOM, aby uniknąć konfliktów CSS, i przywraca historię czatu po przeładowaniu strony za pomocą localStorage.
Stos technologiczny: NestJS, TypeScript, Claude API (Anthropic SDK), Retell AI, osadzenia Voyage AI, OpenAI Whisper, Supabase (PostgreSQL + pgvector), BullMQ, Redis, Next.js, Vite, Docker, nginx, Cloudflare Tunnel
Wyniki
- 4 kanały zintegrowane w 1 pipeline AI: rozmowy głosowe, czat na stronie, Telegram, WhatsApp dzielą rekordy leadów, bazę wiedzy i wyniki
- Rozmowy wychodzące w pełni zautomatyzowane: operatorzy konfigurują kampanię raz, system dzwoni, prowadzi rozmowy, transkrybuje i ocenia każdy kontakt bez udziału SDR-a
- Gotowe do wieloosobowego użytkowania: organizacje, RBAC i bazy wiedzy dla każdej organizacji wbudowane, dzięki czemu platforma może obsługiwać wielu klientów agencji
- W fazie testów z partnerami z 7 usługami Docker, podpisaną weryfikacją webhooków i pokryciem testów w 34 plikach testowych (jednostkowe, integracyjne, zachowanie AI, E2E)
Jak to działa
1. Potencjalny klient kontaktuje się przez jeden z 4 kanałów (widget, telefon, Telegram, WhatsApp)
2. Adapter kanału normalizuje wiadomość i tworzy lub wyszukuje lead
3. ChatService pobiera historię rozmowy i przeprowadza wyszukiwanie semantyczne w bazie wiedzy firmy
4. Agent generuje odpowiedź opartą na pobranych dokumentach
5. Odpowiedź wraca przez ten sam adapter kanału
6. Wynik leadu aktualizuje się na podstawie sygnałów wiadomości lub (w przypadku głosu) analizy sentymentu po rozmowie