Система аналізу телеком-трафіку з AI-Vision
Мета: Автоматизувати критичний бізнес-процес телеком-компанії — аналіз вхідних прайс-листів (Rate Sheets) від постачальників VoIP трафіку. Проблема полягала у різноманітності форматів: постачальники надсилають ціни в Excel, CSV, PDF і навіть картинками (скріншоти в месенджерах). Ручна обробка займала години, що призводило до втрати вигідних угод на динамічному ринку. Вимога: Система має бути "всеїдною", визначати вигідні (BUY) та невигідні (SELL) напрямки, порівнюючи їх з внутрішнім ринковим API, та миттєво сповіщати менеджерів.
Мій Внесок / Рішення: Рішення реалізовано на Self-hosted n8n, з використанням Google Drive, OpenAI (GPT-4o / Turbo) та Google Sheets. Архітектура побудована за принципом "Parent-Child" (Батько-Син) для масштабованості та відмовостійкості.
1. Воркфлоу "Omni-Channel Ingestion" (Батьківські процеси):
Маршрутизація та Черга: Реалізовано логіку Smart Queue. Система сканує Google Drive, ідентифікує тип файлу (.xlsx, .csv, .pdf, .png) та обробляє їх по одному (Batch Size: 1) з інтервалом у 20 хвилин, щоб уникнути перевантаження API та лімітів.
AI Vision & OCR: Для обробки "нечитабельних" форматів (PDF/Images) створено каскад:
CloudConvert: Конвертація багатосторінкових PDF у високоякісні PNG (300 DPI).
GPT-4o Vision: Використання мультимодальної моделі для візуального зчитування таблиць з картинок, де звичайні парсери безсилі.
Smart CSV Parsing: Для великих текстових файлів реалізовано алгоритм "Chunking" — розбиття тексту на пакети по 40 рядків для обробки легшою моделлю GPT-4 Turbo, що суттєво економить бюджет замовника.
2. Воркфлоу "Аналітичне Ядро" (Child Workflow):
Data Enrichment: Впроваджено складний алгоритм матчингу (JavaScript). Система нормалізує назви країн (наприклад, виправляє "Dr Congo" на офіційну назву), визначає MCC/MNC коди за внутрішнім довідником та класифікує тип трафіку (Direct/HQ/SS7/Sim) на основі метаданих файлу.
Market Intelligence: Інтеграція із зовнішнім API (interconnect.solutions). Кожен рядок прайсу перевіряється в реальному часі для отримання ринкової медіани.
Logic Engine: Автоматичний розрахунок маржинальності. Система присвоює статус BUY (якщо ціна нижче ринку) або SELL, та сортує пропозиції від найвигідніших.
3. Надійність та UX:
Error Handling: Налаштовано глобальний перехоплювач помилок та локальні Retry-стратегії (3 спроби) для нестабільних HTTP-запитів.
Reporting: Фінальний результат формується у вигляді інтерактивного HTML-звіту в Telegram з посиланнями на оригінал та оброблений файл, а також Top-15 рекомендацій для менеджерів.
Результат: Замовник отримав повністю автоматизований відділ закупівлі трафіку:
Універсальність: Система обробляє будь-який вхідний файл, від Excel до фотографії екрану.
Швидкість реакції: Час від отримання файлу до прийняття рішення скоротився з годин до хвилин.
Економічний ефект: Менеджери отримують готові "сигнали" (Buy Alerts) і не витрачають час на ручне порівняння тисяч рядків.
Стабільність: Завдяки чергам та оптимізації запитів система працює 24/7 без збоїв API.
#n8n #OpenAI #GPT4o #ComputerVision #Automation #Telecommunications #VoIP #JavaScript #GoogleDriveAPI #DataEngineering #CloudConvert #TelegramBot
Мій Внесок / Рішення: Рішення реалізовано на Self-hosted n8n, з використанням Google Drive, OpenAI (GPT-4o / Turbo) та Google Sheets. Архітектура побудована за принципом "Parent-Child" (Батько-Син) для масштабованості та відмовостійкості.
1. Воркфлоу "Omni-Channel Ingestion" (Батьківські процеси):
Маршрутизація та Черга: Реалізовано логіку Smart Queue. Система сканує Google Drive, ідентифікує тип файлу (.xlsx, .csv, .pdf, .png) та обробляє їх по одному (Batch Size: 1) з інтервалом у 20 хвилин, щоб уникнути перевантаження API та лімітів.
AI Vision & OCR: Для обробки "нечитабельних" форматів (PDF/Images) створено каскад:
CloudConvert: Конвертація багатосторінкових PDF у високоякісні PNG (300 DPI).
GPT-4o Vision: Використання мультимодальної моделі для візуального зчитування таблиць з картинок, де звичайні парсери безсилі.
Smart CSV Parsing: Для великих текстових файлів реалізовано алгоритм "Chunking" — розбиття тексту на пакети по 40 рядків для обробки легшою моделлю GPT-4 Turbo, що суттєво економить бюджет замовника.
2. Воркфлоу "Аналітичне Ядро" (Child Workflow):
Data Enrichment: Впроваджено складний алгоритм матчингу (JavaScript). Система нормалізує назви країн (наприклад, виправляє "Dr Congo" на офіційну назву), визначає MCC/MNC коди за внутрішнім довідником та класифікує тип трафіку (Direct/HQ/SS7/Sim) на основі метаданих файлу.
Market Intelligence: Інтеграція із зовнішнім API (interconnect.solutions). Кожен рядок прайсу перевіряється в реальному часі для отримання ринкової медіани.
Logic Engine: Автоматичний розрахунок маржинальності. Система присвоює статус BUY (якщо ціна нижче ринку) або SELL, та сортує пропозиції від найвигідніших.
3. Надійність та UX:
Error Handling: Налаштовано глобальний перехоплювач помилок та локальні Retry-стратегії (3 спроби) для нестабільних HTTP-запитів.
Reporting: Фінальний результат формується у вигляді інтерактивного HTML-звіту в Telegram з посиланнями на оригінал та оброблений файл, а також Top-15 рекомендацій для менеджерів.
Результат: Замовник отримав повністю автоматизований відділ закупівлі трафіку:
Універсальність: Система обробляє будь-який вхідний файл, від Excel до фотографії екрану.
Швидкість реакції: Час від отримання файлу до прийняття рішення скоротився з годин до хвилин.
Економічний ефект: Менеджери отримують готові "сигнали" (Buy Alerts) і не витрачають час на ручне порівняння тисяч рядків.
Стабільність: Завдяки чергам та оптимізації запитів система працює 24/7 без збоїв API.
#n8n #OpenAI #GPT4o #ComputerVision #Automation #Telecommunications #VoIP #JavaScript #GoogleDriveAPI #DataEngineering #CloudConvert #TelegramBot