Генерація повноцінного відео з 0
22 USDЭтап 1. Импорт сценария
Цель: Получение субтитров
Функциональность:
- Загрузка ютуб канала по ссылке (youtube_dl, yt-dlp);
- Получение списка всех видео пользователя/канала (через YouTube Data API v3);
- Загрузка встроенных субтитров или генерация через ASR (если нет).
Методы:
- yt-dlp (субтитры);
- YouTube API для сбора ссылок;
Этап 2. Получение сценария
Цель: Получить структурированный текст для дальнейшей генерации контента.
Функциональность:
- Рерайтинг блоков с сохранением смысла.
- Разделение текста на блоки (по смыслу или таймкодам);
- Генерация сценария сразу по блокам.
Методы:
- Whisper (через openai/whisper или faster-whisper);
- Простое разделение по паузам или длине блока;
- GPT-4 или Claude для переформулировки (API);
- В случае многосерийных видео — батчинг и обработка в фоне.
Этап 3. Генерация изображений
Цель: Сгенерировать AI-изображения/видео для определенного количества времени озвучки.(условно первый блок занимает 1 минуту. я как пользователь софта хочу выбирать сколько изображений или видео должно быть в этой минуте. 5,10,15 и тд.)
Функциональность генерации изображения:
- Автоматическая генерация промтов (по теме блока);
- Генерация изображений через выбранный движок;
- Возможность выбрать стиль изображение;
Функциональность генерации видео:
Софт для масс регестрирования учётных записей на платформе klingai.com
Импортирование сгенерированного изображения
Возможность введения промпта для каждого отдельного изображения или группы изображений
генерация видео на основе первого изображения с учётом стандартного промпта, либо с учётом кастомногопромпта под изображение
Методы:
-
- Midjourney через Discord-бота (если допустимо);
- Настраиваемые шаблоны промтов (prompt-engineering).
Этап 4. Озвучка
Цель: Озвучить каждый блок текстовки выбранным голосом.
Функциональность:
- Поддержка нескольких голосов и языков;
- Автосинхронизация аудио и блока;
- Сохранение аудиофайлов в нужной структуре.
Методы:
- ElevenLabs API (наиболее качественные голоса);
- Сохранение таймингов и аудио в WAV/MP3.
Этап 5. Автоматический монтаж
Цель: Собрать итоговое видео из компонентов.
Функциональность:
- Комбинация изображений/видео, озвучки и фоновой музыки;
- Добавление переходов и титров;
- Добавление общего шаблона (эффекты, скорость и тп.) Условно у нас есть эффект который создает блики на видео, он цикличный на 5секунд. Мы закидываем это видео в папку с генерацией, для определенного проекта.(1 проект = 1 канал), и софт при монтаже видео накладывает голос, эффекты, переходы на наши сгенерированные картинки или видео.
- Генерация выходного видео в 16:9 (MP4).
Методы:
- FFmpeg (для склейки, наложения звука и видео);
- moviepy (Python-библиотека для базовой логики);
- Автоматическая генерация субтитров и таймингов;
- Опционально — редактор UI (React + Electron).
Стек
Backend:
- Python (основа пайплайна)
- FastAPI или Flask (для API-интерфейсов)
- PostgreSQL / SQLite (хранение данных)
- Redis / Celery (очереди задач)
Audio/Video:
- yt-dlp (скачивание видео/аудио)
- Whisper / Faster-Whisper (ASR)
- FFmpeg, moviepy (монтаж)
- Text-to-Speech APIs (ElevenLabs, Google, Azure)
AI / LLM:
- OpenAI GPT-4 (рерайтинг, промтинг)
- Claude (Anthropic) (альтернатива)
- DALL·E, Stable Diffusion, Midjourney (визуализация)
Цену предлагайте сами, все обсудим.
-
319 Good afternoon, we are engaged in web development, Telegram bot development, website layout on PHP, frameworks Laravel, HTML, CSS, including WordPress. We develop websites on PHP, frameworks on Laravel, and mobile applications for iOS and Android turnkey.
We develop websites on PHP and mobile applications for iOS and Android.
We have experience in creating CRM/ERP systems.
We are ready to execute your order turnkey.
We develop websites on WordPress and mobile applications for iOS and Android. The total development experience is 7 years. We are ready to execute your order turnkey.
1. Projects
https://berkanaplus.com.ua/ - This site was migrated and server configured.
2. https://leondesign.kyiv.ua/
… PHP version updates and plugin updates.
3. https://peg.com.ua/
Development of a new module for the site for dynamic product price updates.
https://uvali.com.ua/
Dedicated server VPS configuration. 📈 Internet marketing and promotion:
Google Ads, Facebook, TikTok advertising setup
SEO and copywriting
Promotion through push notifications and in-app advertising
Marketing analytics, A/B testing, campaign optimization
📈 Internet marketing and promotion:
Google Ads, Facebook, TikTok advertising setup
SEO and copywriting
🎨 Design solutions:
In-house design department
UI/UX design, branding, advertising creatives
-
1591 8 0 Hello
I am a developer in the field of ML/DL. I am ready to complete your project. Write to me, let's discuss.
-
726 9 1 Hello! I have reviewed the project and am ready to start working. I am confident you will be satisfied with the result.
-
8773 60 0 1 Hello! I am ready to assist with your project. SolidWay has extensive experience in developing similar systems, including video processing automation and content generation. Our team can implement all the stages you described, from script import to automatic video editing.
We use modern technologies such as Python, FastAPI, and various APIs for working with audio and video. For example, in our practice, we have had projects where we performed subtitle selection, text generation, and automatic editing, which allows us to confidently handle the tasks you set.
We will discuss the project details to determine the timeline and budget. Looking forward to your response for further discussion!
Current freelance projects in the category AI & Machine Learning
AI/NLP engineer with strong healthcare document processing experience.We are looking for an experienced AI/NLP engineer with strong healthcare document processing experience. Our project involves recognition, parsing, and structured analysis of medical documents, especially SNF / long-term care documents and MDS assessments. The goal is to… AI & Machine Learning ∙ 1 hour 47 minutes back ∙ 6 proposals |
Create a Chrome plugin for connecting to a proxyCreate a Chrome plugin for connecting to a proxy I am looking for a developer, possibly with AI who has successfully published similar plugins in the store just AI writing without development experience is not needed please send proposals regarding price and deadlines AI & Machine Learning, Web Programming ∙ 4 hours 52 minutes back ∙ 24 proposals |
Need to transfer the website from Figma + Webflow to code, possibly with AI.Need to transfer the site from Figma + Webflow to code, possibly with AI. If it's possible to do it with AI, with 100% accuracy and without bugs, it's better to do it that way. Please write your price and what experience you have specifically with this task. AI & Machine Learning, AI Art ∙ 4 hours 54 minutes back ∙ 21 proposals |
AI Video Creator & 3D Artist for Innovative AI-EdTech Project (Radaastrea): We are looking for a 3D artist / AI video maker for an innovative AI-EdTech project (Radaastreya)Description: We are creating a large-scale media franchise and concept of an empathetic next-generation AI robot for teenagers — RADAASTREYA. The image is of a wise and bright… AI & Machine Learning, Gaming Apps ∙ 1 day back ∙ 1 proposal |
N8n Architecture and Deployment ReviewLanguage Our tech team speaks English, Russian and German. You can choose any of these languages for your text deliverable and the review call. ObjectiveWe operate production-ready AI and document workflows on n8n Cloud that integrate Salesforce with LLMs and document services.… AI & Machine Learning, AI Consulting ∙ 1 day 4 hours back ∙ 14 proposals |