Wan 2.7 от Alibaba: обзор AI-видео с Thinking Mode

Что умеет Wan 2.7 от Alibaba: режим мышления перед рендером, точный текст и логотипы, уникальные лица, звук, до 15 сек. Цены, версии, где брать в РФ без VPN.

Снова Артём, обозреватель Flami. В прошлый раз разбирал Hailuo под эмоции, теперь Wan, и это совсем про другое. Если меня спросить, какая модель лучше всех рисует читаемый текст на упаковке и не лепит всем героям одно и то же «AI-лицо», я отвечу не задумываясь: Wan 2.7.

Я её гонял на товарке, где в кадре должна быть видна надпись на коробке и логотип. Большинство моделей тут позорятся, рисуют псевдо-буквы. Wan вытягивает.

Видео

Что за Wan и при чём тут «мышление»

Wan делает Alibaba, точнее их Tongyi Lab. Версию 2.7 представили 6 апреля 2026-го, и главная её фишка вынесена прямо в заголовок анонса: Thinking Mode, режим мышления.

Звучит как маркетинг, но за этим есть конкретная механика. Обычная модель сразу хватает промпт и начинает рисовать. Wan 2.7 сначала прогоняет по запросу цепочку рассуждений: разбирает композицию, прикидывает движение камеры, логику кадра, и только потом запускает генерацию.

«Сначала модель глубоко понимает промпт, логически планирует композицию и только потом генерирует финальный результат.» — пресс-релиз Alibaba о запуске Wan 2.7

На практике это значит меньше артефактов и точнее попадание в задумку, особенно на сложных сценах с несколькими объектами. Платишь за это временем: режим мышления чуть дольше обычной генерации. Но по моим прогонам оно того стоит, когда кадр непростой.

Три вещи, ради которых я её держу

Текст и логотипы. Это её корона. Wan рисует читаемые надписи, вывески, подписи на упаковке, причём с поддержкой 12 языков, включая кириллицу. Для рекламы и e-commerce, где на товаре должно быть видно название бренда, это решает.

Уникальные лица. Знаете этот эффект, когда у AI все люди на одно лицо, такое усреднённо-красивое? Wan держит строение лица, форму глаз и ещё кучу мелких черт, и герои выходят разными. Для кампании с несколькими персонажами или сериального контента это важнее, чем кажется.

Физика. Wan хорошо рисует, как предмет реально работает в кадре. Блендер крутится, утюг гладит, шуруповёрт вкручивает. Поэтому под демонстрацию товара в действии я обычно беру именно её.

Цифры, без которых не выбрать

Теперь по характеристикам, со ссылкой на платформы, где её крутят.

Длина: до 15 секунд за ролик, по данным fal.ai поддерживается диапазон от 2 до 15 секунд. Это в разы больше ранних версий Wan. Разрешение 720p и 1080p, нативный звук с синхронизацией губ прямо во время генерации, а не отдельной постобработкой.

Форматы стандартные: 16:9, 9:16, 1:1, плюс 4:3 и 3:4. На вход до 9 картинок-источников. Ещё есть контроль цвета через HEX-коды, прямо вписываете точное значение фирменного цвета, и модель его держит. Для брендов, у которых цвет прописан в гайдлайне, это редкая и полезная штука.

Сколько стоит на самом деле

Тут разброс по площадкам, приведу для ориентира. На fal.ai Wan 2.7 идёт по $0.10 за секунду видео, то есть 10-секундный ролик в 1080p выходит примерно в доллар. На WaveSpeedAI тариф разделён: $0.10 за секунду в 720p и $0.15 в 1080p.

У нас в Flami Wan 2.7 она в общей подписке, в рублях, актуальные цены в кабинете. Кроме флагмана доступны версии постарше: Wan 2.6, 2.5, 2.2 Fast и 2.2. Логика простая: 2.7 даёт максимум, но дольше и дороже, старшие версии быстрее и дешевле под объём.

Одна важная оговорка про доступ

Раньше Wan была известна как открытая модель, веса лежали в опенсорсе, и народ крутил её локально. С 2.7 Alibaba закрыла веса, доступ теперь только через API. Для нас, кто пользуется через сервис, разницы ноль. Но если вы рассчитывали поднять Wan 2.7 на своём железе, увы, не выйдет, для этого остаются ранние версии.

Где Wan, а где её соседи

Чтоб не путаться, как я раскидываю задачи между моделями:

| Задача | Модель | |---|---| | Текст, логотипы, упаковка в кадре | Wan 2.7 | | Физика предмета в работе | Wan 2.7 | | Премиум-свет, кино-картинка | Veo 3.1 | | Эмоция крупным планом | Hailuo | | Динамика и облёты камеры | Kling 3.0 |

Сравнивать Wan и Veo «кто лучше вообще» бессмысленно. Veo красивее по свету, Wan надёжнее по тексту и физике. Разные руки.

Чек-лист: брать ли Wan 2.7

✓ В кадре должен быть читаемый текст, логотип, упаковка
✓ Нужны разные лица героев без «AI-клонов»
✓ Товар должен убедительно работать в кадре
✓ Нужен точный фирменный цвет по HEX
✓ Нужен ролик до 15 секунд за один проход
✗ Хотите запустить модель локально на своём сервере, веса 2.7 закрыты
✗ Главное это кино-свет и атмосфера, тут сильнее Veo

Что дальше

Готовлю разборы Seedance 2.0, HappyHorse 1.0 и Grok Imagine. Плюс хочу отдельно показать связку: базовый ролик в Wan, доводка в Runway.

Попробовать Wan 2.7 без зарубежной карты и VPN можно в Flami, всё в рублях.

FAQ

Что такое Wan 2.7? Последняя версия видеомоделей от Alibaba, релиз 6 апреля 2026. Делает ролики до 15 секунд с уникальными лицами, точным текстом и логотипами, нативным звуком. Ключевая особенность, режим мышления перед генерацией.

Что такое Thinking Mode? Перед рендером модель прогоняет цепочку рассуждений: раскидывает, куда едет камера и что в каком углу кадра. Дольше обычной генерации, но точнее результат и меньше артефактов.

Какая длина и разрешение? До 15 секунд, 720p и 1080p, нативный звук с синхронизацией губ.

Можно ли запустить Wan 2.7 локально? Нет, веса 2.7 закрыты, доступ только через API. Для локального запуска остаются ранние версии Wan.

Чем Wan отличается от Veo и Kling? Wan сильнее в тексте, логотипах и физике предметов плюс режим мышления. Veo выигрывает в свете, Kling в динамике.

Поддерживает ли русский в тексте на видео? Да, рендер текста поддерживает 12 языков, включая кириллицу.

Есть ли Wan в РФ? Напрямую нужна зарубежная карта и API. Через Flami доступна в рублях без VPN.

Wan 2.7 от Alibaba: модель, которая думает перед тем, как рендерить