Облачный видеорендеринг сервис на GPU с Telegram-ботом, локальным Whisper и интеграциями API
Облачный видеорендер сервис на GPU с Telegram-ботом, локальным Whisper и интеграциями с Fal AI (Flux Schnell и Wan 2)
1. Цель проекта
Создать облачный видеорендер сервис с Telegram-интерфейсом, который:
Принимает файлы и инструкции через Telegram-бота
Подтягивает картинки через API Fal AI Flux Schnell
Подтягивает видео через API Fal AI (модель Wan 2)
Локально генерирует субтитры (Whisper)
Рендерит всё на GPU (через ffmpeg/OpenCV/SDK)
Выдает готовый результат через Google Drive
2. Технологический стек
Telegram Bot API (Python: [aiogram, pyrogram] или Node.js)
ffmpeg с поддержкой GPU (NVENC, CUDA, VideoToolbox)
OpenCV с CUDA (при необходимости для кастомной обработки кадров)
Fastvideo SDK (если нужно ускорение, по бюджету)
OpenAI Whisper (локально, CPU/GPU, через Python binding)
Fal AI API (Flux Schnell — картинки, Wan 2 — видео)
Google Drive API (заливка готовых видео)
Облако: DigitalOcean (или AWS/GCP), обязательно GPU-инстансы
Docker (контейнеры для изоляции рендер-воркеров)
(Опционально) Kubernetes для автоматического масштабирования
3. Основная логика работы
3.1. Telegram бот
Принимает инструкции, файлы пользователя (текст, аудио, видео, параметры).
Показывает статусы (“очередь”, “рендерится”, “готово”).
Позволяет выбрать шаблон, стиль, задать текст для субтитров.
3.2. Пайплайн рендеру
Запрос пользователя получен → добавляется в очередь (очередь на Redis/DB).
Подтягиваются картинки через API Fal AI Flux Schnell
Отправить prompt, получить url/jpg/png.
Подтягивается видео через Fal AI Wan 2
API запрос, получить mp4/mov или url.
Генерируются субтитры через Whisper
Аудио (если нужно) подается в Whisper (локально на GPU/CPU).
Результат — srt/txt файл.
Рендеринг видео на GPU
Все элементы собираются (видео, картинки, аудио, субтитры) в один видеоролик.
ffmpeg с полной поддержкой GPU.
Опционально кастомная обработка через OpenCV CUDA.
Готовый файл загружается на Google Drive
Создается уникальная папка/ссылка.
Пользователю отправляется ссылка в Telegram
4. Технические требования к рендеру
Рендеринг 10-15 видео (1 час каждое) параллельно
ffmpeg запускается с параметрами NVENC/CUDA
Добавление аудио/видео/субтитров — только через GPU
Whisper устанавливается локально (через Docker или system-wide)
Fal AI API — интеграция через REST, обработка ошибок/ретрай
Все промежуточные файлы удаляются после завершения рендеру
5. Архитектура (схематично)
Пользователь (Telegram)
Telegram Bot
↕Render Queue Manager (очередь рендеру, мониторинг статусов)
↕Render Worker (Docker):
Фетчит данные с Fal AI (картинки/видео)
Вызывает Whisper для субтитров
Склеивает видео (ffmpeg на GPU)
Загружает результат в Google Drive
Сообщает Queue Manager/боту
6. Минимальные требования к серверу
DigitalOcean GPU droplet (8+ ядер CPU, 32+ GB RAM, 1+ GPU, NVMe SSD)
Docker установлен
Python 3.10+, Node.js (если нужно для ботов)
ffmpeg с поддержкой CUDA/NVENC
OpenCV с CUDA
Whisper (инсталляция через pip + модели)
Доступ к интернету для API Fal AI и Google Drive
7. Пример пайплайна (псевдокод)
# 1. Фетч картинки через Fal AI Flux Schnell
image_url = fal_api.get_image(prompt)
download(image_url)
# 2. Фетч видео через Fal AI Wan 2
video_url = fal_api.get_video(params)
download(video_url)
# 3. Whisper (локально) -> получить субтитры
subtitles = whisper.transcribe(audio_file)
# 4. ffmpeg (GPU) — собрать видео
cmd = f"ffmpeg -hwaccel cuda -i video.mp4 -i image.jpg -vf 'subtitles=subs.srt' -c:v h264_nvenc output.mp4"
run(cmd)
# 5. Загрузить в Google Drive, получить ссылку
link = google_drive.upload('output.mp4')
telegram_bot.send_message(user_id, link)
8. Что должен сделать разработчик
Поднять Telegram-бота (или доработать, если уже есть)
Написать обработчик для интеграции с Fal AI (2 эндпоинта)
Подготовить воркер рендеру (Docker), который:
Тянет медиа с API
Вызывает локальный Whisper
Генерирует субтитры в SRT
Запускает ffmpeg на GPU со всеми параметрами
Загружает видео на Google Drive
Пишет статусы назад в Telegram
Обеспечить масштабирование и параллельность (много Docker-воркеров)
Документация по запуску и деплою
9. Документация/Отчеты
Описать деплой на DigitalOcean (или другую облако), инструкции по поднятию контейнеров, подключению к API
README с примерами команд и тестирования
10. Сроки и бюджет
Предложить сроки на реализацию MVP (basic flow, 1-2 воркера)
Оценить бюджет на запуск в DigitalOcean на 1 месяц работы (ориентир: 1-2 GPU droplets)
Готов предоставить дополнительные детали (API Fal AI, примеры prompt’ов, примеры видео/картинок для теста) — по запросу.
-
1017 2 1 Привет! 👋
У меня есть практический опыт в парсинге данных (реальные проекты, работа с API, структуризация и обработка информации) и создании Telegram-ботов. Также я делал несколько PET-проектов с использованием AI:
BizzAi — бот с генерацией бизнес-ответов;
fuckupcoach — интерактивный бот-коуч.
Знаю, как работать с API интеграциями, очередями и автоматизацией, и готов реализовать MVP для вашего сервиса:
…
Telegram-бот для приема данных и выдачи результатов;
интеграция с Fal AI API;
локальная работа с Whisper для генерации субтитров;
организация пайплайна рендеринга на GPU (ffmpeg, OpenCV, Docker);
загрузка готовых результатов на Google Drive и уведомление пользователя.
Могу быстро включиться в работу, освоить специфические инструменты (CUDA, ffmpeg с GPU, масштабирование воркеров) и документировать процесс.
Буду рад присоединиться к реализации этого проекта 🚀
-
1595 7 0 Добрый день!
Меня зовут Роман, и я вхожу в топ-5 разработчиков в категории «Искусственный интеллект и машинное обучение» среди ~1600 специалистов на платформе.
Гарантирую:
- Быстрое и качественное выполнение задания
- Четкое соблюдение дедлайнов
- Регулярная связь на протяжении всего процесса
Буду рад обсудить детали вашего проекта в личных сообщениях.
-
330 2 0 Здраствуйте.
Имею опыт в реализации AI переписок - могу показать диалоги готовых чатов и результатов
Так-же есть наработы максимально реалестичных фотографий - так же готов показать результаты.
Я думаю из описания мы поняли друг друга для чего ваш сервис - и быстро найдем общий язык
-
10123 117 0 Привет.
Разрабатываю ботов для телеграма на NodeJS. Готов взяться. Пишите, обсудим.
-
978 5 1 Добрый день, готов взяться за задание, есть подобный готовый бот но под другие задачи но умею работать с Fal API бот как раз на нем подключен к Halioai вот ссылка на портфолио https://freelancehunt.com/showcase/work/bot-dlya-avtomatichnoyi-generatsiyi-video-po/1973705.html
Готов переделать под ваши задачи, api для тестов понадобиться это точно затраты на тесты будут примерно 10$ и выше
Доступ к серверу, если нету зарегистрироваться и дать мне доступ, сам настрою окружение, в целом с сет что вы описали в тз смогу собрать
Мой 1 день стоит 2000 грн
Сделаю скорее всего раньше 7 дней но мне нужно несколько дней тестов чтобы точно все было хорошо)
Ссылка на видео работыGoogle Drive
Актуальные фриланс-проекты в категории Python
Создание многофункционального бота в Телеграм
1000 UAH
(Все материалы предоставлю в приватные сообщения) Вот детальное описание проекта: После нажатия кнопки /start Бот присылает текст с правилами и условиями пользования (под текстом, кнопка ‘ознакомлен’) После нажатия на кнопку, следующее сообщение ‘проверка на подписку’ Три… Python, Разработка ботов ∙ 4 часа 31 минута назад ∙ 61 ставка |
Найти товарный фид (Google Merchant XML) для сайта на OpenCart
700 UAH
Необходимо найти прямую ссылку на действующий товарный фид (XML) конкурента для Google Merchant Center Платформа (CMS): OpenCart / ocStore Найти оригинальный фидТребования к результату: Рабочая ссылка на XML-файл Python, Парсинг данных ∙ 2 дня 17 часов назад ∙ 22 ставки |
Розработка Тик-Ток фермы (контент-завод)Необзодимо разработать систему для централизованного управления несколькими TikTok-аккаунтами с автоматической публикацией контента, использованием индивидуальных прокси и имитацией естественной активности аккаунтов. Функциональные требования1. Управление аккаунтами Добавление… Python, Разработка ботов ∙ 3 дня 5 часов назад ∙ 19 ставок |
Улучшить работу Claude Code и работа с написанием софтаСейчас разрабатываю СРМ и Аналитику, софт. Делаю через Клод Код, но понимаю что результаты не лучшие в плане изменений. Есть 2 задачи - Нужно помочь сделать пресет по навыкам, мд и так далее чтобы улучшить качество. Взять проверенные с которыми работали, а не с интернета… AI и машинное обучение, Python ∙ 3 дня 11 часов назад ∙ 24 ставки |
Система OCRНужна система распознавания текста на почтовых конвертах (индекс кому - только числа). Текст иногда может быть рукописным. Распознавание марок (подсчет количества и номинала) Python ∙ 3 дня 14 часов назад ∙ 26 ставок |