Veo 3: полный гид по генерации видео от Google с озвучкой
Veo 3: полный гид по генерации видео от Google
Veo 3 -- это модель генерации видео от Google DeepMind, доступная в Нейроне. Ее главное преимущество -- встроенная генерация звука: персонажи говорят, окружение звучит, а музыка подстраивается под сцену. В этом гиде разберем структуру промптов, возможности и ограничения.
Структура промпта для Veo 3
Базовая формула:
Субъект + Действие + Звук
Опциональные элементы: сцена, камера, стиль.
Субъект (кто или что)
Описание главного объекта или персонажа в кадре.
-
Молодой мужчина в кожаной куртке -
Рыжий кот -
Старый маяк на скале
Действие (что происходит)
Конкретное действие, движение, изменение в кадре.
-
идет по дождливой улице и поднимает воротник -
прыгает за бабочкой на лугу -
луч маяка прорезает туман
Звук (что слышно)
Звуковое сопровождение -- ключевая особенность Veo 3.
-
звук шагов по лужам, шум дождя, далекий гром -
мяуканье, шорох травы, жужжание бабочки -
персонаж говорит: "Я наконец-то дома"
Создание видео из изображения
Veo 3 умеет оживлять статичные картинки. Отправьте изображение и опишите, что должно произойти.
Промпт к фото пейзажа: Оживи фото: облака медленно плывут, трава колышется от ветра, птица пролетает на горизонте. Звук: шум ветра, шелест травы, далекое пение птицы
Промпт к фото портрета: Человек на фото поворачивает голову, улыбается и говорит: "Привет, как дела?" Легкий ветер шевелит волосы. Звук: голос, фоновый шум улицы
Совет: при работе с изображением описывайте только то, что должно измениться. Фон и композиция останутся как на оригинале.
Примеры готовых промптов
Портрет с речью
Крупный план женщины с темными волосами. Она смотрит в камеру, слегка наклоняет голову и говорит: "Знаешь, иногда нужно просто остановиться и посмотреть вокруг." Мягкая улыбка. Фон -- вечерний город в боке. Звук: голос, далекий шум города
Динамичная сцена
Бегун в спортивной форме стартует с низкого старта на беговой дорожке стадиона. Камера следует сбоку на уровне ног. Резкое ускорение, гравий летит из-под шиповок. Звук: хлопок стартового пистолета, звук шагов, тяжелое дыхание
Атмосферная сцена
Старая деревянная лодка покачивается на тихом озере в тумане. Рыбак в клетчатой рубашке закидывает удочку. Раннее утро, молочный туман, лучи солнца начинают пробиваться. Статичная камера с берега. Звук: плеск воды, скрип дерева, далекое кукование кукушки
Анимация
Мультипликационный стиль. Маленькая мышка в красном берете рисует картину на крошечном мольберте. Она макает кисточку в краску, делает мазок, отходит, оценивает работу, довольно кивает. Теплые пастельные цвета. Звук: тихая скрипичная мелодия, шорох кисти
Природа
Замедленная съемка. Колибри зависает перед красным цветком, быстро взмахивая крыльями. Хоботок касается нектара. Солнечный свет подсвечивает переливающиеся перья. Размытый зеленый фон тропического сада. Звук: быстрое жужжание крыльев, тропические птицы
Городская сцена
Таймлапс вечернего города. Солнце садится за небоскребами, зажигаются огни окон, фары машин создают световые потоки на дорогах. Статичная камера с крыши. Переход от золотого часа к синему часу. Звук: приглушенный гул города, далекие сирены
Управление камерой
Veo 3 поддерживает разные типы движения камеры:
| Тип | Описание | Промпт |
|-----|---------|--------|
| Панорама | Горизонтальное движение | Камера панорамирует слева направо |
| Тилт | Вертикальное движение | Камера поднимается от ног к лицу |
| Зум | Приближение/удаление | Медленный зум на лицо |
| Долли | Камера едет к/от объекта | Камера плавно подъезжает к двери |
| Слежение | Камера следует за объектом | Камера следует за бегуном сбоку |
| Аэро | Вид сверху | Аэросъемка с высоты, камера опускается |
| Статика | Неподвижная камера | Статичная камера, общий план |
Стилевые настройки
-
Кинематографичный -- широкий экран, кинематографичная палитра, глубина резкости
-
Документальный -- ручная камера, естественное освещение, реалистичный стиль
-
Мультипликационный -- 2D или 3D анимация, яркие цвета
-
Ретро-пленка -- зернистость, выцветшие цвета, мерцание
-
Замедленная съемка -- слоу-моушн для динамичных сцен
-
Таймлапс -- ускоренная съемка длительных процессов
Управление освещением
-
Золотой час --
мягкий золотистый свет заката, длинные тени -
Синий час --
сумеречный синий свет, последние минуты перед темнотой -
Полдень --
жесткий верхний свет, короткие тени, высокий контраст -
Ночь --
неоновые источники света, городская подсветка -
Студийный --
мягкий рассеянный свет, нейтральный фон -
Контровой --
источник света за объектом, силуэтный эффект
Ограничения Veo 3
-
Длительность -- до 8 секунд на одну генерацию
-
Разрешение -- до 720p (1280x720)
-
Частота кадров -- 24 fps
-
Консистентность -- при сложных сценах персонаж может немного меняться
-
Текст -- рендеринг текста в видео менее стабилен, чем в изображениях
Совет: для более длинных видео с высоким разрешением попробуйте Sora 2 -- до 20 секунд в 1080p.
Veo 3 vs Sora 2
Детальное сравнение с Sora 2 читайте в гиде по Sora 2. Краткая сводка:
| Параметр | Veo 3 | Sora 2 |
|----------|-------|--------|
| Разработчик | Google | OpenAI |
| Длительность | 8 сек | 20 сек |
| Разрешение | 720p | 1080p |
| Генерация звука | Отлично | Отлично |
| Скорость | Быстрее | Медленнее |
| Работа с фото | Да | Ограниченно |
| Сильная сторона | Звук и речь | Длительность и реализм |
Для редактирования существующих видео смотрите гид по Runway Aleph.
Советы для продвинутых
-
Начинайте с простого -- один персонаж, одно действие, потом усложняйте
-
Звук меняет восприятие -- добавление звука делает видео в разы убедительнее
-
Описывайте эмоцию -- "задумчиво", "с облегчением", "с тревогой"
-
Указывайте темп -- "медленно", "резко", "плавно"
-
Используйте паузы в речи -- "Он говорит: 'Я... не знаю.' (пауза) 'Может быть.'"
Часто задаваемые вопросы
Что такое Veo 3?
Veo 3 -- модель генерации видео от Google DeepMind, доступная в боте Нейрон. Она создает видеоролики до 8 секунд со встроенной генерацией звука, речи и музыки. Поддерживает создание видео по текстовому описанию и оживление статичных изображений.
Как создать видео с озвучкой?
Добавьте в промпт описание звукового сопровождения. Для речи используйте прямую речь в кавычках: персонаж говорит: "текст". Для звуков опишите их: звук шагов, шум дождя. Для музыки: фоновая мелодия на пианино. Veo 3 автоматически синхронизирует звук с видео.
Veo 3 vs Sora 2?
Veo 3 быстрее генерирует и лучше работает с озвучкой и речью. Sora 2 создает более длинные видео (20 сек vs 8 сек) в высоком разрешении (1080p vs 720p) с более реалистичной физикой. Оба доступны в Нейроне -- выбирайте под задачу.
Какие ограничения у Veo 3?
Максимальная длительность -- 8 секунд, разрешение -- 720p (1280x720), частота -- 24 кадра в секунду. Для более длинных и качественных видео используйте Sora 2. Veo 3 лучше подходит для коротких сцен с акцентом на звук и речь.
Попробуйте бесплатно в Нейроне -- создайте видео с озвучкой за пару минут.