System analizy ruchu telekomunikacyjnego z AI-Vision
Cel: Zautomatyzować krytyczny proces biznesowy firmy telekomunikacyjnej — analizę przychodzących cenników (Rate Sheets) od dostawców ruchu VoIP. Problem polegał na różnorodności formatów: dostawcy przesyłają ceny w Excelu, CSV, PDF, a nawet w postaci obrazków (zrzuty ekranu w komunikatorach). Ręczne przetwarzanie zajmowało godziny, co prowadziło do utraty korzystnych transakcji na dynamicznym rynku. Wymaganie: System musi być "wszechstronny", określać korzystne (BUY) i niekorzystne (SELL) kierunki, porównując je z wewnętrznym rynkowym API, oraz natychmiast powiadamiać menedżerów.
Mój wkład / rozwiązanie: Rozwiązanie zrealizowane na samodzielnie hostowanym n8n, z wykorzystaniem Google Drive, OpenAI (GPT-4o / Turbo) oraz Google Sheets. Architektura zbudowana na zasadzie "Parent-Child" (Rodzic-Dziecko) dla skalowalności i odporności na awarie.
1. Workflow "Omni-Channel Ingestion" (Procesy rodzicielskie):
Routing i kolejka: Zrealizowano logikę Smart Queue. System skanuje Google Drive, identyfikuje typ pliku (.xlsx, .csv, .pdf, .png) i przetwarza je pojedynczo (Batch Size: 1) z interwałem 20 minut, aby uniknąć przeciążenia API i limitów.
AI Vision & OCR: Do przetwarzania "nieczytelnych" formatów (PDF/Obrazy) stworzono kaskadę:
CloudConvert: Konwersja wielostronicowych PDF na wysokiej jakości PNG (300 DPI).
GPT-4o Vision: Wykorzystanie modelu multimodalnego do wizualnego odczytu tabel z obrazków, gdzie zwykłe parsery są bezsilne.
Smart CSV Parsing: Dla dużych plików tekstowych zrealizowano algorytm "Chunking" — dzielenie tekstu na pakiety po 40 wierszy do przetwarzania przez lżejszy model GPT-4 Turbo, co znacznie oszczędza budżet klienta.
2. Workflow "Analityczne Jądro" (Workflow Dziecka):
Wzbogacenie danych: Wdrożono złożony algorytm dopasowywania (JavaScript). System normalizuje nazwy krajów (na przykład, poprawia "Dr Congo" na oficjalną nazwę), określa kody MCC/MNC według wewnętrznego katalogu oraz klasyfikuje typ ruchu (Direct/HQ/SS7/Sim) na podstawie metadanych pliku.
Inteligencja rynkowa: Integracja z zewnętrznym API (interconnect.solutions). Każdy wiersz cennika jest sprawdzany w czasie rzeczywistym w celu uzyskania rynkowej mediany.
Silnik logiki: Automatyczne obliczanie marżowości. System przypisuje status BUY (jeśli cena jest niższa od rynku) lub SELL, oraz sortuje oferty od najkorzystniejszych.
3. Niezawodność i UX:
Obsługa błędów: Skonfigurowano globalny przechwytywacz błędów oraz lokalne strategie ponownego próbowania (3 próby) dla niestabilnych zapytań HTTP.
Raportowanie: Ostateczny wynik formułowany jest w postaci interaktywnego raportu HTML w Telegramie z linkami do oryginału oraz przetworzonego pliku, a także Top-15 rekomendacji dla menedżerów.
Wynik: Klient otrzymał w pełni zautomatyzowany dział zakupu ruchu:
Uniwersalność: System przetwarza każdy przychodzący plik, od Excela po zdjęcie ekranu.
Szybkość reakcji: Czas od otrzymania pliku do podjęcia decyzji skrócił się z godzin do minut.
Efekt ekonomiczny: Menedżerowie otrzymują gotowe "sygnały" (Buy Alerts) i nie tracą czasu na ręczne porównywanie tysięcy wierszy.
Stabilność: Dzięki kolejkom i optymalizacji zapytań system działa 24/7 bez awarii API.
#n8n #OpenAI #GPT4o #ComputerVision #Automation #Telecommunications #VoIP #JavaScript #GoogleDriveAPI #DataEngineering #CloudConvert #TelegramBot
Mój wkład / rozwiązanie: Rozwiązanie zrealizowane na samodzielnie hostowanym n8n, z wykorzystaniem Google Drive, OpenAI (GPT-4o / Turbo) oraz Google Sheets. Architektura zbudowana na zasadzie "Parent-Child" (Rodzic-Dziecko) dla skalowalności i odporności na awarie.
1. Workflow "Omni-Channel Ingestion" (Procesy rodzicielskie):
Routing i kolejka: Zrealizowano logikę Smart Queue. System skanuje Google Drive, identyfikuje typ pliku (.xlsx, .csv, .pdf, .png) i przetwarza je pojedynczo (Batch Size: 1) z interwałem 20 minut, aby uniknąć przeciążenia API i limitów.
AI Vision & OCR: Do przetwarzania "nieczytelnych" formatów (PDF/Obrazy) stworzono kaskadę:
CloudConvert: Konwersja wielostronicowych PDF na wysokiej jakości PNG (300 DPI).
GPT-4o Vision: Wykorzystanie modelu multimodalnego do wizualnego odczytu tabel z obrazków, gdzie zwykłe parsery są bezsilne.
Smart CSV Parsing: Dla dużych plików tekstowych zrealizowano algorytm "Chunking" — dzielenie tekstu na pakiety po 40 wierszy do przetwarzania przez lżejszy model GPT-4 Turbo, co znacznie oszczędza budżet klienta.
2. Workflow "Analityczne Jądro" (Workflow Dziecka):
Wzbogacenie danych: Wdrożono złożony algorytm dopasowywania (JavaScript). System normalizuje nazwy krajów (na przykład, poprawia "Dr Congo" na oficjalną nazwę), określa kody MCC/MNC według wewnętrznego katalogu oraz klasyfikuje typ ruchu (Direct/HQ/SS7/Sim) na podstawie metadanych pliku.
Inteligencja rynkowa: Integracja z zewnętrznym API (interconnect.solutions). Każdy wiersz cennika jest sprawdzany w czasie rzeczywistym w celu uzyskania rynkowej mediany.
Silnik logiki: Automatyczne obliczanie marżowości. System przypisuje status BUY (jeśli cena jest niższa od rynku) lub SELL, oraz sortuje oferty od najkorzystniejszych.
3. Niezawodność i UX:
Obsługa błędów: Skonfigurowano globalny przechwytywacz błędów oraz lokalne strategie ponownego próbowania (3 próby) dla niestabilnych zapytań HTTP.
Raportowanie: Ostateczny wynik formułowany jest w postaci interaktywnego raportu HTML w Telegramie z linkami do oryginału oraz przetworzonego pliku, a także Top-15 rekomendacji dla menedżerów.
Wynik: Klient otrzymał w pełni zautomatyzowany dział zakupu ruchu:
Uniwersalność: System przetwarza każdy przychodzący plik, od Excela po zdjęcie ekranu.
Szybkość reakcji: Czas od otrzymania pliku do podjęcia decyzji skrócił się z godzin do minut.
Efekt ekonomiczny: Menedżerowie otrzymują gotowe "sygnały" (Buy Alerts) i nie tracą czasu na ręczne porównywanie tysięcy wierszy.
Stabilność: Dzięki kolejkom i optymalizacji zapytań system działa 24/7 bez awarii API.
#n8n #OpenAI #GPT4o #ComputerVision #Automation #Telecommunications #VoIP #JavaScript #GoogleDriveAPI #DataEngineering #CloudConvert #TelegramBot