AI-видео для напитков: пар, капли и лёд, которые продают
Видео для напитков нейросетью: как показать пар над кофе, капли на банке и лёд в стакане, какие модели тянут жидкость и налив и где физика воды подводит.
Запотевшая банка газировки, пар, поднимающийся над кофе, кубик льда, падающий в стакан с брызгами. Это кадры, от которых хочется пить, и раньше их снимали фуд-видеографы за хорошие деньги. Видео для напитков нейросетью пытается повторить эту магию из фото бутылки, и кое-что у неё выходит отлично, а кое-что пока нет. Разберу, что именно.
Что снять в видео для напитков
Продаёт не сама бутылка, а ощущение свежести и вкуса. Несколько кадров делают всю работу. Конденсат: капли на холодной банке кричат «ледяная». Пар над горячим: чай и кофе оживают сразу. Налив и движение жидкости: струя в стакан, водоворот, оседающая пена. Лёд и брызги в динамике. Под движение жидкости и смену планов удобна Kling для динамики, а просчитать физику струи и брызг помогает Wan с режимом мышления, про неё есть обзор Wan 2.7.
Где физика воды ломается
Тут начинается интересное, и честно, не всё гладко. Жидкость это сложнейшая для нейросети физика. Налив часто выглядит неестественно: струя застывает, пена ведёт себя как поролон, брызги замирают в воздухе нелогично. Лёд модель рисует то мутным, то как стекло. А этикетку на запотевшей бутылке легко смазывает каплями до нечитаемости.
Я сам не раз получал красивый кадр, где вода ведёт себя как желе, и приходилось перегенерировать. Поэтому сложную динамику налива гоняю по несколько раз и отбираю кадр, где жидкость выглядит живой, а не застывшей. На простом конденсате и паре модели ошибаются куда реже, с них и стоит начинать.
Рабочий приём
Если этикетка должна быть читаемой, я её не топлю в каплях: генерирую чистую бутылку и атмосферу отдельно, а ответственные надписи держу там, где модель их не смажет. Простые кадры, банка с конденсатом, чашка с паром, выходят надёжно и сразу аппетитно. Сложный налив с брызгами беру, только когда он реально нужен, и закладываю время на отбор.
Собрать ролик напитка из фото бутылки можно во Flami: на конденсате и паре получается быстро, а сложную динамику стоит прогнать несколько раз и выбрать живой кадр.
Часто задаваемые вопросы
Как показать свежесть напитка в ролике?
Через конденсат на холодной таре, пар над горячим, движение жидкости и лёд с брызгами. Эти кадры создают ощущение вкуса и температуры: чем холоднее или горячее выглядит напиток, тем сильнее срабатывает.
Почему нейросеть плохо рисует налив и брызги?
Жидкость это сложная физика, и модель часто застывает струю, делает пену похожей на поролон, а брызги замирают нелогично. Сложную динамику приходится перегенерировать по несколько раз и отбирать кадр, где вода выглядит живой.
Какая нейросеть лучше для видео напитков?
Под движение жидкости и смену планов удобна Kling, а физику струи и брызг точнее просчитывает Wan с режимом мышления. На простых кадрах с конденсатом и паром справляются обе, сложный налив требует отбора.
Как сохранить читаемую этикетку на запотевшей бутылке?
Не топить надпись в каплях: генерировать чистую бутылку и атмосферу отдельно, а ответственный текст держать там, где модель его не смажет. Капли поверх этикетки нейросеть легко размывает до нечитаемости.
Источники
Об авторе
Артём Соколов
Обозреватель Flami