AI Engineer / ComfyUI Expert / RunPod (Image/Video Generation)
Вакансия: AI Engineer / ComfyUI Expert / RunPod (Image/Video Generation)
Формат: Проектная работа / Контракт.
Бюджет согласовываем после интервью.
Стек: Python, Docker, ComfyUI, RunPod SDK.
О ПРОЕКТЕ
Мы запускаем AI SaaS-платформу. Наш фокус — не просто картинки, а и качественное AI-видео (Img2Video, Txt2Video, Avatars).
Архитектура: Backend (Supabase) отправляет задачи в GPU-кластер (RunPod Serverless).
⚠️ КЛЮЧЕВОЙ ФОКУС: ВИДЕО И ОПТИМИЗАЦИЯ
Это не вакансия для тех, кто просто умеет писать промты.
Video-First: Мы работаем с тяжелыми видео-пайплайнами (SVD, AnimateDiff, Wan, LTKV). Ты должен понимать, как генерировать видео без ошибок памяти (OOM) и артефактов.
Adaptation over Creation: Нам не нужно, чтобы ты собирал все воркфлоу с нуля годами. Мы ожидаем, что ты умеешь брать готовые сложные JSON-схемы из комьюнити (OpenArt/CivitAI), разбирать их, чинить, выкидывать лишнее и оптимизировать под наш продакшн.
ЗАДАЧИ:
1. Инфраструктура (Docker & RunPod)
Production Image: Собрать оптимизированный Docker-образ с ComfyUI и
runpod-pythonSDK.Network Volume Strategy: Настроить архитектуру так, чтобы тяжелые веса (Checkpoints, VAE, Video Models) лежали на сетевом диске (Network Volume), а не в самом образе. Это критично для быстрого холодного старта.
LoRA Caching: Реализовать "умную" загрузку пользовательских LoRA (Check cache -> Download from R2 -> Generate).
2. Инжиниринг Видео-Воркфлоу
Стабилизация: Настройка параметров (motion_bucket_id, fps, interpolation), чтобы видео было плавным, а не дерганым.
VRAM Management: Ты понимаешь, как настроить ComfyUI (tiled_decode, lowvram), чтобы генерация 4-секундного видео не крашила воркер с 24GB VRAM.
API Preparation: Превращение "спагетти-нод" в чистый API-формат (JSON), где параметризированы только нужные поля.
3. Python Handler (Logic)
Написать Python-скрипт (обвязку внутри контейнера), который:
Валидирует входящий JSON.
Запускает ComfyUI execution.
Загружает результат (MP4/PNG) напрямую в Cloudflare R2.
Отправляет вебхук на бэкенд о готовности.
ТЕХНИЧЕСКИЕ ТРЕБОВАНИЯ:
RunPod Serverless: Глубокое понимание платформы (Worker lifecycle, Network Volumes).
Video Generation Stack: Опыт работы с Stable Video Diffusion (SVD), AnimateDiff.
Workflow Debugging: Умение читать ошибки в консоли и понимать, какая именно Custom Node сломала пайплайн.
Python & Docker: Умение писать чистые Dockerfile (CUDA support).
БУДЕТ ПЛЮСОМ:
Опыт настройки пайплайна обучения (Kohya_ss / OneTrainer) в облаке.
Опыт написания своих Custom Nodes на Python.
Кейс "Cold Start": Наш контейнер весит 15GB из-за моделей. Холодный старт занимает 5 минут. Как конкретно вы сократите это время до 15-20 секунд на RunPod?
Кейс "Video OOM": Мы генерируем 4 секунды видео через SVD (Stable Video Diffusion) на карте 24GB. Процесс падает с ошибкой CUDA Out of Memory. Ваши действия по оптимизации настроек ComfyUI?
Кейс "Dynamic LoRA": В запросе пришла ссылка на LoRA модель, которой нет на диске воркера. Опишите алгоритм вашего хендлера: как он скачает, куда положит и как обеспечит, чтобы диск не переполнился?
Еще актуальные вакансии в категории Бэкенд
Junior+ Backend / Middle QA Auto (Python / JS & AI Automation)
- Удаленная работа
- Полная занятость
Residential Proxy Infrastructure Engineer
- Удаленная работа
- Полная занятость
[HIRING] Набір команди для GTA 5 RP / FiveM проекту
- Удаленная работа
- Полная занятость
Distributed Proxy Network (Networking / Backend)
- Удаленная работа
- Полная занятость
UX/UI Designer Needed for EVM-Based DeFi Trading Platform (Web & Mobile)
- Удаленная работа
- Полная занятость
