В рамках киноклуба «Премьера» в Барнауле состоялся мастер-класс по работе с искусственным интеллектом. Участники встречи познакомились со списком нейросетей, которые они могут использовать для создания фото-, видео- и аудиоконтента.
![](/upload/resize_cache/freematiq_field_blocks/067/7v730qe1lx01ege9td6biff3qjhgrtxk/730_490_1/IMG_20240416_184515.jpg)
Полёт на Луну
Мастер-класс провёл Данил Шубин — 3D-художник и моушн-дизайнер. Он создает оформление заставок и титров для телеканала, видеоигры — для Яндекса, проводит лекции о нейросетях студентам медианаправления в Алтайском филиале РАНХиГС. На мастер-классе Данил показал в том числе и свои работы с применением нейросетей — сюжеты детской студии тележурналистики. В кадре, конечно, настоящие дети, пробующие себя в роли журналистов, а вот на заднем плане появляются нарисованные нейросетями картинки.
— У нас детская передача, где рассказывают об интересных научных фактах. На видео мной всегда дорисовывается какая-то графика. И когда чего-то нет или нельзя это снять, я использую нейросети, — объясняет Данил. — Например, нам нужно было рассказать о том, что раньше на Луне были вулканы, и так как у нас нет таких изображений, их можно сгенерировать. Есть неудачные варианты, где на заднем плане появилась еще одна Луна. Если вы сгенерировали картинку, но она нуждается в доработке, это тоже можно сделать с помощью нейросети. Хотите убрать дерево или заменить цвет бабочки — закрашиваете элемент на картинке и задаете нейросети промт (ставите задачу. — Прим. автора), что сделать с этим фрагментом.
В киноиндустрии нейросети используют более хитрыми способами. Участникам мастер-класса показали не только готовые проекты, но и их бэкстейдж. И если по итоговому видео в принципе непонятно, как оно делалось, то пошаговый разбор работы над ним показывает: вот съемки в павильоне, вот съёмки у зелёного экрана, вот вместо «зелёнки» накладывается видео морских волн — на этом этапе нейросети ещё не задействованы. Они помогают преобразовать видеоряд в определённую стилистику, добавить эффект нарисованности, ведь действие происходит внутри картины. А подражание разным художественным стилям — это как раз то, что нейросеть умеет.
Запрос с умом
— Видеоролик под названием Digital nature («Цифровая природа») не сгенерирован нейросетью, его сделали два художника из России. Кадры природы не отсняты, а нарисованы в визуальной программе. Год назад это было потрясающе. Сейчас такие видео можно генерировать. Вы, наверное, слышали, что появилась нейросеть Sora. И если заключить договор с Sora, то не придётся строить съёмочный павильон, сэкономив за счёт использования искусственного интеллекта. Это переворачивает мир киноиндустрии.
В видео про цифровую природу лишь сменяющиеся пейзажи, в основном статичные, максимум движения — перекатывающиеся волны, ветер, колышущий травы в поле. Нейросеть уже научилась генерировать и подобные ролики, и более динамичные — например, собаку на скейтборде, плывущую медузу, вид из-за руля гоночного автомобиля. Этой собаки и этой машины никогда не существовало, это «фантазия» искусственного интеллекта, основанная на просмотре множества «настоящих» видео собак и машин.
В режиме реального времени участники мастер-класса сделали несколько изображений с помощью ряда программ. Процесс работы даёт понять, как формулировать запрос, чтобы нейросеть правильно его выполнила. Так, словом «котик» можно получить морского котика, а не домашнего кота. Если мы попросим нарисовать собаку, ждущую трамвай на остановке, то трамвай на картинке уже будет подъезжать (так как он упомянут в запросе), а пёс может оказаться не один.
Помимо того, как эффективнее общаться с искусственным интеллектом, барнаульцы задались и более дискуссионными вопросами: не считается ли такая работа плагиатом, может ли нейросеть сделать ненужной работу актёров и дублёров.
— Навряд ли. Все равно нужен человек, который сформирует запрос, подготовит исходные материалы. Да, для производства контента нужно меньше людей, но полностью всех нейросеть заменить не может, — уверен моушн-дизайнер.
Без акцента
— В фильмах нейросети используются для перевода голоса на другой язык. Это практично. А те нейросети, которые доступны всем нам, мы можем использовать для дикторской озвучки текстов, — демонстрирует Данил Шубин. — Если мне нужна определённая интонация, приходится добавлять знаки препинания — например, точку вместо занятой, чтобы пауза была побольше, или восклицательный знак посреди предложения. Иногда нужно помогать ставить ударения. Поэтому графически текст, который читает нейросеть, отличается от того написания, к которому мы привыкли.
С помощью нейросети исполнили песню из «Смешариков» «От винта». Оба варианта отличаются от исходного по стилистике. И голос, и инструментальное сопровождение не принадлежат живым людям, они сгенерированы. При этом голос звучит очень правдоподобно, без роботизированного акцента. А вот мотив мелодии немножко сдвинут — то ли из-за обозначенных стилистик музыки, то ли из-за специфики работы нейросети. Помимо генерации искусственного звука можно доверить ей обработку записанного живого голоса.
— Когда мы записывали детей, я недоглядел, что звук записался очень плохо, он был полностью бракованным, — приводит пример Данил. — Нейросеть Enhance Speech предназначена для обработки звука. Она убирает шумы, иногда даже слишком, поэтому всё нужно перепроверять. После обработки наше видео звучит хорошо.
Несколько доступных нейросетей для создания картинок:
Freepik — генерирует картинки по текстовому запросу;
Glif.App — генерирует изображения с неявными надписями, встроенными в картинку;
Patterned Ai — создает паттерны для обоев или одежды.