2 вариант – для создания видео (к примеру) истории и рассказы, интересные факты и тп
Буду описывать по примеру работы с ChatGPT, немного пробовал с ним работать в этом направлении) Но готов рассматривать разные варианты нейросетей
1. Общий принцип работы
- Разделение текста:
- Текст делится на абзацы, предложения или заранее установленное количество частей. (думаю предложения и абзацы неплохой вариант)
- Каждая часть текста отправляется в запрос для генерации картинки.
- Генерация картинок:
- Используется ChatGPT (с DALL·E) или Stable Diffusion или еще что-то. С чат GPT немного работал в этом планет с Diffusion нет
- Картинка создаётся на основе текста, сохраняется в заданной папке.
- Монтаж:
- Картинки и текст синхронизируются с аудиодорожкой (озвучкой текста).
- Итоговая последовательность собирается в видеоредакторе.
2. Особенности работы с запросами
- Работа начинается не с новой ветки, а с определённой ветки чата GPT, его нужно немного обучить и потом можно работать
- Добавление уточняющих промптов:
- Иногда текстовый запрос может выдавать ошибку или некорректный результат.
- Для исправления добавляется дополнительный промпт:
"СДЕЛАЙ МНЕ КАРТИНКУ СОГЛАСНО ТЕКСТУ В РАЗРЕШЕНИИ…". Или что-то подобное (промпт можно корректировать). Сталкивался с этим и в некоторых случаях помогает. По хорошему промпт нужно добавлять всегда, уточнив стиль картинки, разрешение и тп
- Устранение ошибок:
- Ошибки чаще всего на тапе генерации картинок.
- Возможны пропуски, которые придётся контролировать вручную.
- Также заметил, что есть лимит на генерацию картинок, нужна пауза или временная остановка запроса или ожидание
3. Алгоритм работы программы
- Начало работы:
- Текст копируется и делится на части.
- Каждая часть вставляется в запрос для генерации картинки.
- Генерация и сохранение картинки:
- Картинка скачивается и сохраняется в указанной папке.
- Если процесс завершился успешно, переходит к следующему текстовому блоку.
- Обработка ошибок:
- Если картинка не создаётся или создается в ненужно размере (такое бывает), программа автоматически повторяет запрос с уточнением:
"СДЕЛАЙ МНЕ КАРТИНКУ СОГЛАСНО ТЕКСТУ В ТАКОМ-ТО РАЗРЕШЕНИИ". Промпт можно где-то корректировать
- Если картинка не создаётся или создается в ненужно размере (такое бывает), программа автоматически повторяет запрос с уточнением:
- Перезапуск работы:
- Если повторный запрос не сработал, программа перезапускается вручную или автоматически. Или же просто чат начал выдавать ерунду. Снова вручную обучил и запустил
- При перезапуске она начинает с последнего успешно сохранённого файла (картинки).
4. Три варианта работы с ошибками
- Автоматический повтор запроса:
- Программа добавляет уточнение к запросу и повторяет его.
- Ручной контроль:
- Если автоматический повтор не срабатывает, перезапуск процесса вручную.
- Программа продолжает с последнего сохранённого изображения.
- Контроль ошибок вручную:
- Пропущенные шаги фиксируются и дорабатываются вручную после завершения основного цикла.
5. Возможные проблемы и их решение
- Ошибка на этапе генерации картинки:
- Использовать дополнительный запрос для уточнения (например, изменить стиль, формат, разрешение). По сути дополнительный промпт
- Сбой последовательности:
- Программа должна сохранять историю успешных шагов, чтобы при сбое начать с последнего сохранённого состояния.
- Неполный автоматизм:
- Полный автоматизм думаю сложно обеспечить, поэтому предусмотрен ручной контроль ключевых этапов – по хорошему буду мониторить происходяшее. Даже при условии, что софт сделает 60-80% работы на автомате – это уже хорошо. Остальное или перезапуск и повтор цикла или же своими руками
6. Итоговая цель
- Создать последовательность: Текст → Картинка → Озвучка → Монтаж.
- Обеспечить плавный процесс с минимальным количеством сбоев.
- В случае проблем иметь возможность вручную контролировать и корректировать процесс.
Еще проблемы с которыми сталкивался, чат в 90% случав выдавал мне формат webp (если не ошибаюсь) и не сохранял с нужным названием) Хотя я просил другие форматы и названия.
Еще одна из проблем, которую не знаю как описать. Нужно совместить автоматизацию и ручной режим. Когда я єкспереиентировал и делал 2 часовую историю, то сразу нумеровал абзацы и потом соглавно нумерации абзацев сохранял картинки под такми же номером. Здесь тоже что-то подобное нужно сделать, чтоб можно было понимать, что именно нужно доделать и переделать
Актуальные фриланс-проекты в категории C#
Небольшая игра для Unity 2dТз тут, сцена, UI, графика уже есть нужно только запрограммировать https://www.figma.com/design/btykPl7Odr8ggvwmTqO8pH/Robo-Loop?node-id=0-1&t=vlanszjRgKHH5U5m-1 C# ∙ 2 дня 12 часов назад ∙ 15 ставок |
Сравнительный анализ эффективности кастомного ПО (v2.2-field) и эталонного ПО (Meshtastic v2.x)
1000 UAH
Сравнительный анализ эффективности кастомного ПО (v2.2-field) и эталонного ПО (Meshtastic v2.x) на идентичной аппаратной платформе (ESP32 + SX1268, 2W) по критериям дальности, пропускной способности, стабильности линка и энергопотребления. Провести тесты с замерами с учетом… C и C++, C# ∙ 6 дней 15 часов назад ∙ 2 ставки |
Создание плагина для интеграции с POS-системой Syrve, C#Разработать плагин для POS-системы Syrve (on-premise), который устанавливается на сервер заведения. Плагин должен: (1) передавать на наш сервер данные в режиме реального времени — заказы, статусы столов, платежи, чеки; (2) принимать команды от Reservble — подтверждения… C#, Веб-программирование ∙ 9 дней 11 часов назад ∙ 14 ставок |