Хмарний відео-рендер сервіс на GPU з Telegram-ботом, локальним Whisper та інтеграціями API
Хмарний відео-рендер сервіс на GPU з Telegram-ботом, локальним Whisper та інтеграціями з Fal AI (Flux Schnell та Wan 2)
1. Мета проекту
Створити хмарний відео-рендер сервіс із Telegram-інтерфейсом, який:
Приймає файли й інструкції через Telegram-бота
Підтягує картинки через API Fal AI Flux Schnell
Підтягує відео через API Fal AI (модель Wan 2)
Локально генерує субтитри (Whisper)
Рендерить усе на GPU (через ffmpeg/OpenCV/SDK)
Видає готовий результат через Google Drive
2. Технологічний стек
Telegram Bot API (Python: [aiogram, pyrogram] або Node.js)
ffmpeg з підтримкою GPU (NVENC, CUDA, VideoToolbox)
OpenCV з CUDA (за потреби для кастомної обробки кадрів)
Fastvideo SDK (якщо потрібно прискорення, за бюджетом)
OpenAI Whisper (локально, CPU/GPU, через Python binding)
Fal AI API (Flux Schnell — картинки, Wan 2 — відео)
Google Drive API (заливка готових відео)
Хмара: DigitalOcean (або AWS/GCP), обов’язково GPU-інстанси
Docker (контейнери для ізоляції рендер-воркерів)
(Опційно) Kubernetes для автоматичного масштабування
3. Основна логіка роботи
3.1. Telegram бот
Приймає інструкції, файли користувача (текст, аудіо, відео, параметри).
Показує статуси (“черга”, “рендериться”, “готово”).
Дозволяє обрати шаблон, стиль, задати текст для субтитрів.
3.2. Пайплайн рендеру
Запит користувача отримано → додається у чергу (черга на Redis/DB).
Підтягуються картинки через API Fal AI Flux Schnell
Надіслати prompt, отримати url/jpg/png.
Підтягується відео через Fal AI Wan 2
API запит, отримати mp4/mov або url.
Генеруються субтитри через Whisper
Аудіо (якщо потрібно) подається у Whisper (локально на GPU/CPU).
Результат — srt/txt файл.
Рендеринг відео на GPU
Всі елементи збираються (відео, картинки, аудіо, субтитри) в один відеоролик.
ffmpeg з повною підтримкою GPU.
Опціонально кастомна обробка через OpenCV CUDA.
Готовий файл заливається на Google Drive
Створюється унікальна папка/посилання.
Користувачу надсилається посилання у Telegram
4. Технічні вимоги до рендеру
Рендеринг 10-15 відео (1 година кожне) паралельно
ffmpeg запускається з параметрами NVENC/CUDA
Додавання аудіо/відео/субтитрів — тільки через GPU
Whisper встановлюється локально (через Docker або system-wide)
Fal AI API — інтеграція через REST, обробка помилок/ретрай
Усі проміжні файли видаляються після завершення рендеру
5. Архітектура (схематично)
User (Telegram)
Telegram Bot
↕Render Queue Manager (черга рендеру, моніторинг статусів)
↕Render Worker (Docker):
Фетчить дані з Fal AI (картинки/відео)
Викликає Whisper для субтитрів
Склеює відео (ffmpeg на GPU)
Завантажує результат у Google Drive
Повідомляє Queue Manager/бота
6. Мінімальні вимоги до серверу
DigitalOcean GPU droplet (8+ ядер CPU, 32+ GB RAM, 1+ GPU, NVMe SSD)
Docker встановлений
Python 3.10+, Node.js (якщо потрібно для ботів)
ffmpeg із підтримкою CUDA/NVENC
OpenCV із CUDA
Whisper (інсталяція через pip + моделі)
Доступ до інтернету для API Fal AI та Google Drive
7. Зразок пайплайну (псевдокод)
# 1. Фетч картинку через Fal AI Flux Schnell
image_url = fal_api.get_image(prompt)
download(image_url)
# 2. Фетч відео через Fal AI Wan 2
video_url = fal_api.get_video(params)
download(video_url)
# 3. Whisper (локально) -> отримати субтитри
subtitles = whisper.transcribe(audio_file)
# 4. ffmpeg (GPU) — зібрати відео
cmd = f"ffmpeg -hwaccel cuda -i video.mp4 -i image.jpg -vf 'subtitles=subs.srt' -c:v h264_nvenc output.mp4"
run(cmd)
# 5. Upload to Google Drive, get link
link = google_drive.upload('output.mp4')
telegram_bot.send_message(user_id, link)
8. Що має зробити розробник
Підняти Telegram-бота (або доопрацювати, якщо вже є)
Написати обробник для інтеграції з Fal AI (2 ендпоїнта)
Підготувати воркер рендеру (Docker), що:
Тягне медіа з API
Викликає локальний Whisper
Генерує субтитри у SRT
Запускає ffmpeg на GPU з усіма параметрами
Завантажує відео на Google Drive
Пише статуси назад у Telegram
Забезпечити масштaбування та паралельність (багато Docker-воркерів)
Документація по запуску та деплою
9. Документація/Звіти
Описати деплой на DigitalOcean (або іншу хмару), інструкції по підняттю контейнерів, підключенню до API
README з прикладами команд і тестування
10. Терміни та бюджет
Запропонувати терміни на реалізацію MVP (basic flow, 1-2 воркери)
Оцінити бюджет на запуск у DigitalOcean на 1 місяць роботи (орієнтир: 1-2 GPU droplets)
Готовий надати додаткові деталі (API Fal AI, приклади prompt’ів, приклади відео/картинок для тесту) — на вимогу.
-
1017 2 1 Вітаю! 👋
Я маю практичний досвід у парсингу даних (реальні проєкти, робота з API, структуризація та обробка інформації) та створенні Telegram-ботів. Також робив кілька PET-проєктів з використанням AI:
BizzAi — бот із генерацією бізнес-відповідей;
fuckupcoach — інтерактивний бот-коуч.
… Знаю, як працювати з API інтеграціями, чергами та автоматизацією, і готовий реалізувати MVP для вашого сервісу:
Telegram-бот для прийому даних і видачі результатів;
інтеграція з Fal AI API;
локальна робота з Whisper для генерації субтитрів;
організація пайплайну рендеру на GPU (ffmpeg, OpenCV, Docker);
завантаження готових результатів на Google Drive та повідомлення користувача.
Можу швидко включитися в роботу, освоїти специфічні інструменти (CUDA, ffmpeg з GPU, масштабування воркерів) та документувати процес.
Буду радий долучитися до реалізації цього проєкту 🚀
-
1595 7 0 Доброго дня!
Мене звати Роман, і я входжу до топ-5 розробників у категорії «Штучний інтелект і машинне навчання» серед ~1600 фахівців на платформі.
Гарантую:
- Швидке та якісне виконання завдання
- Чітке дотримання дедлайнів
- Регулярний зв’язок протягом усього процесу
Буду радий обговорити деталі вашого проекту у приватних повідомленнях.
-
330 2 0 Здравствуйте.
Маю досвід у реалізації AI переписок - можу показати діалоги готових чатів і результатів.
Також є напрацювання максимально реалістичних фотографій - також готовий показати результати.
Я думаю, з опису ми зрозуміли одне одного, для чого ваш сервіс - і швидко знайдемо спільну мову.
-
10063 117 0 Вітаю.
Розробляю ботів для телеграму на NodeJS. Готовий взятися. Пишіть, обговоримо.
-
954 5 1 Доброго дня, готовий взятися за завдання, є подібний готовий бот, але під інші задачі, але вмію працювати з Fal API, бот якраз на ньому підключений до Halioai, ось посилання на портфоліо https://freelancehunt.com/showcase/work/bot-dlya-avtomatichnoyi-generatsiyi-video-po/1973705.html
Готовий переробити під ваші задачі, api для тестів знадобиться це точно, витрати на тести будуть приблизно 10$ і вище
Доступ до сервера, якщо немає, зареєструватися і дати мені доступ, сам налаштую середовище, в цілому з сетом, що ви описали в тз, зможу зібрати
Мій 1 день коштує 2000 грн
Зроблю, скоріше за все, раніше 7 днів, але мені потрібно кілька днів тестів, щоб точно все було добре)
Посилання на відео роботиGoogle Drive
Актуальні фриланс-проєкти в категорії Python
Парсинг даних через мобільне APIШукаю людину з досвідом парсингу даних через мобільне API, для парсингу e-commerce, rozetka та аналоги Завдання: 1. Перехоплення трафіку мобільного додатку (Android) налаштування проксі, аналіз запитів 2. Визначення потрібних API endpoints, куди йдуть запити, які headers… Python, Парсинг даних ∙ 1 день тому ∙ 24 ставки |
Знайти товарний фід (Google Merchant XML) для сайту на OpenCart
700 UAH
Необхідно знайти пряме посилання на діючий товарний фід (XML) конкурента для Google Merchant Center Платформа (CMS): OpenCart / ocStore Знайти оригінальний фідВимоги до результату: Робоче посилання на XML-файл Python, Парсинг даних ∙ 6 днів 9 годин тому ∙ 28 ставок |
Розробка Тік-Ток ферми (контент-завод)Необхідно розробити систему для централізованого управління кількома TikTok-акаунтами з автоматичною публікацією контенту, використанням індивідуальних проксі та імітацією природної активності акаунтів. Функціональні вимоги1. Управління акаунтами Додавання та видалення… Python, Розробка ботів ∙ 6 днів 20 годин тому ∙ 22 ставки |
Покращити роботу Claude Code та роботу з написанням програмного забезпеченняЗараз розробляю СРМ та Аналітику, софт. Роблю через Клод Код, але розумію, що результати не найкращі в плані змін. Є 2 задачі - Потрібно допомогти зробити пресет по навичкам, мд і так далі, щоб покращити якість. Взяти перевірені, з якими працювали, а не з інтернету перші. - В… AI та машинне навчання, Python ∙ 7 днів 3 години тому ∙ 28 ставок |
Система OCRПотрібна система розпізнавання тексту на поштових конвертах (індекс кому - лише числа). Текст інколи може бути рукописним Розпізнавання марок (підрахунок кількості та номіналу) Python ∙ 7 днів 6 годин тому ∙ 28 ставок |