Система анализа телеком-трафика с AI-Vision
Мета: Автоматизировать критически важный бизнес-процесс телеком-компании — анализ входящих прайс-листов (Rate Sheets) от поставщиков VoIP трафика. Проблема заключалась в разнообразии форматов: поставщики отправляют цены в Excel, CSV, PDF и даже картинками (скриншоты в мессенджерах). Ручная обработка занимала часы, что приводило к потере выгодных сделок на динамичном рынке. Требование: Система должна быть "всеядной", определять выгодные (BUY) и невыгодные (SELL) направления, сравнивая их с внутренним рыночным API, и мгновенно уведомлять менеджеров.
Мой Вклад / Решение: Решение реализовано на Self-hosted n8n, с использованием Google Drive, OpenAI (GPT-4o / Turbo) и Google Sheets. Архитектура построена по принципу "Parent-Child" (Родитель-Ребенок) для масштабируемости и отказоустойчивости.
1. Воркфлоу "Omni-Channel Ingestion" (Родительские процессы):
Маршрутизация и Очередь: Реализована логика Smart Queue. Система сканирует Google Drive, идентифицирует тип файла (.xlsx, .csv, .pdf, .png) и обрабатывает их по одному (Batch Size: 1) с интервалом в 20 минут, чтобы избежать перегрузки API и лимитов.
AI Vision & OCR: Для обработки "нечитабельных" форматов (PDF/Images) создан каскад:
CloudConvert: Конвертация многостраничных PDF в высококачественные PNG (300 DPI).
GPT-4o Vision: Использование мультимодальной модели для визуального считывания таблиц с картинок, где обычные парсеры бессильны.
Smart CSV Parsing: Для больших текстовых файлов реализован алгоритм "Chunking" — разбитие текста на пакеты по 40 строк для обработки более легкой моделью GPT-4 Turbo, что существенно экономит бюджет заказчика.
2. Воркфлоу "Аналитическое Ядро" (Дочерний Воркфлоу):
Data Enrichment: Внедрен сложный алгоритм матчинга (JavaScript). Система нормализует названия стран (например, исправляет "Dr Congo" на официальное название), определяет MCC/MNC коды по внутреннему справочнику и классифицирует тип трафика (Direct/HQ/SS7/Sim) на основе метаданных файла.
Market Intelligence: Интеграция с внешним API (interconnect.solutions). Каждая строка прайса проверяется в реальном времени для получения рыночной медианы.
Logic Engine: Автоматический расчет маржинальности. Система присваивает статус BUY (если цена ниже рынка) или SELL, и сортирует предложения от самых выгодных.
3. Надежность и UX:
Error Handling: Настроен глобальный перехватчик ошибок и локальные Retry-стратегии (3 попытки) для нестабильных HTTP-запросов.
Reporting: Финальный результат формируется в виде интерактивного HTML-отчета в Telegram с ссылками на оригинал и обработанный файл, а также Top-15 рекомендаций для менеджеров.
Результат: Заказчик получил полностью автоматизированный отдел закупки трафика:
Универсальность: Система обрабатывает любой входной файл, от Excel до фотографии экрана.
Скорость реакции: Время от получения файла до принятия решения сократилось с часов до минут.
Экономический эффект: Менеджеры получают готовые "сигналы" (Buy Alerts) и не тратят время на ручное сравнение тысяч строк.
Стабильность: Благодаря очередям и оптимизации запросов система работает 24/7 без сбоев API.
#n8n #OpenAI #GPT4o #ComputerVision #Automation #Telecommunications #VoIP #JavaScript #GoogleDriveAPI #DataEngineering #CloudConvert #TelegramBot
Мой Вклад / Решение: Решение реализовано на Self-hosted n8n, с использованием Google Drive, OpenAI (GPT-4o / Turbo) и Google Sheets. Архитектура построена по принципу "Parent-Child" (Родитель-Ребенок) для масштабируемости и отказоустойчивости.
1. Воркфлоу "Omni-Channel Ingestion" (Родительские процессы):
Маршрутизация и Очередь: Реализована логика Smart Queue. Система сканирует Google Drive, идентифицирует тип файла (.xlsx, .csv, .pdf, .png) и обрабатывает их по одному (Batch Size: 1) с интервалом в 20 минут, чтобы избежать перегрузки API и лимитов.
AI Vision & OCR: Для обработки "нечитабельных" форматов (PDF/Images) создан каскад:
CloudConvert: Конвертация многостраничных PDF в высококачественные PNG (300 DPI).
GPT-4o Vision: Использование мультимодальной модели для визуального считывания таблиц с картинок, где обычные парсеры бессильны.
Smart CSV Parsing: Для больших текстовых файлов реализован алгоритм "Chunking" — разбитие текста на пакеты по 40 строк для обработки более легкой моделью GPT-4 Turbo, что существенно экономит бюджет заказчика.
2. Воркфлоу "Аналитическое Ядро" (Дочерний Воркфлоу):
Data Enrichment: Внедрен сложный алгоритм матчинга (JavaScript). Система нормализует названия стран (например, исправляет "Dr Congo" на официальное название), определяет MCC/MNC коды по внутреннему справочнику и классифицирует тип трафика (Direct/HQ/SS7/Sim) на основе метаданных файла.
Market Intelligence: Интеграция с внешним API (interconnect.solutions). Каждая строка прайса проверяется в реальном времени для получения рыночной медианы.
Logic Engine: Автоматический расчет маржинальности. Система присваивает статус BUY (если цена ниже рынка) или SELL, и сортирует предложения от самых выгодных.
3. Надежность и UX:
Error Handling: Настроен глобальный перехватчик ошибок и локальные Retry-стратегии (3 попытки) для нестабильных HTTP-запросов.
Reporting: Финальный результат формируется в виде интерактивного HTML-отчета в Telegram с ссылками на оригинал и обработанный файл, а также Top-15 рекомендаций для менеджеров.
Результат: Заказчик получил полностью автоматизированный отдел закупки трафика:
Универсальность: Система обрабатывает любой входной файл, от Excel до фотографии экрана.
Скорость реакции: Время от получения файла до принятия решения сократилось с часов до минут.
Экономический эффект: Менеджеры получают готовые "сигналы" (Buy Alerts) и не тратят время на ручное сравнение тысяч строк.
Стабильность: Благодаря очередям и оптимизации запросов система работает 24/7 без сбоев API.
#n8n #OpenAI #GPT4o #ComputerVision #Automation #Telecommunications #VoIP #JavaScript #GoogleDriveAPI #DataEngineering #CloudConvert #TelegramBot