← Все статьиИнтересные исследования

Image to video на arena.ai: вторая арена об оживлении фото и неожиданный взлёт Grok

Артём Соколов15 июня 2026 г.Чтение займёт 4 мин
Обложка статьи Flami

Рейтинг image to video на arena.ai: Seedance 2.0 и Grok Imagine в верхушке, Veo 3.1 и Kling следом. Вторая арена для сверки оживления фото товара нейросетью.

Ниже русский разбор зачёта оживления фото на arena.ai, бывшей LMArena. Оригинал: arena.ai/leaderboard/image-to-video. Это вторая арена в дополнение к нашему разбору по Artificial Analysis, цифры у площадок разные. Срез живой, актуальные значения смотрите в источнике.

Режим «картинка на входе, ролик на выходе» я уже разбирал по бенчмарку Artificial Analysis. Но держать одну арену рискованно: у каждой свои тестовые сцены и своя аудитория. Поэтому сел за вторую площадку. Image to video на arena.ai устроен как огромный краудсорсинговый зачёт: на срез от 10 июня 2026 года тут 41 модель и больше 1,2 миллиона голосов, выборка солиднее. И верхушка вышла с сюрпризом.

Image to video на arena.ai: верхушка зачёта

| Место | Модель | Elo | Голосов | |---|---|---|---| | 1 | gemini-omni-flash (Google) | 1475 | 3 014 | | 2 | Seedance 2.0 720p (ByteDance) | 1475 | 68 354 | | 3 | Grok Imagine Video 1.5 preview | 1467 | 20 616 | | 4 | HappyHorse 1.0 | 1446 | 48 242 | | 5 | Grok Imagine Video 720p | 1422 | 420 989 |

Первое, что цепляет: Seedance 2.0 для оживления фото делит вершину с новой gemini-omni-flash, у обеих Elo 1475. Но у Google пометка Preliminary (предварительная оценка) и всего три тысячи голосов против шестидесяти восьми тысяч у Seedance, так что надёжнее тут именно ByteDance. Разбор модели я давал в исследовании Seedance 2.0.

Главный сюрприз ниже. Сразу две версии Grok Imagine для быстрого оживления фото забрались в пятёрку: превью-версия третьей, а обычная пятой, причём у неё больше 420 тысяч голосов, рекорд таблицы. Раньше Grok брал в основном дешевизной, а тут он уже не компромисс, а полноценный участник верхушки. Что у модели с реальными товарными роликами, я писал в обзоре Grok Imagine.

Где привычные фавориты

Veo 3.1 для премиум-оживления на этой арене шестая со звуком (Elo 1398), её сильные стороны в обзоре Veo 3.1. Kling в свежей версии v3 Pro идёт двенадцатой с 1359, подробности в обзоре Kling 3.0. А Hailuo 2.3 для эмоций в кадре стоит на 1260: в общем зачёте середина, но эту модель берут не за место в таблице, а за мимику крупным планом, о чём я рассказывал в обзоре Hailuo.

Сравните с нашим разбором того же режима по второй арене, Artificial Analysis: порядок похож в верхушке, но в деталях площадки расходятся, и это нормально.

Как читать этот рейтинг под карточку

Практическая рамка простая. Для оживления фото товара важно не общее место, а то, бережёт ли модель ваш исходник: цвет, фактуру, логотип. Этого ни одна арена не меряет, она про общую красоту движения. Поэтому верхушку я держу как короткий список кандидатов, а решает всё проверка на вашем собственном исходнике. Как выстроить сам процесс оживления, я расписывал в гайде про image to video для фото товара.

Все модели из обеих арен открываются во Flami в соседних вкладках, так что сверить кандидатов на своём товаре проще, чем спорить, чья площадка правее.

Часто задаваемые вопросы

Какая нейросеть лучше всего оживляет фото на arena.ai?

На срезе от 10 июня 2026 года вершину делят Seedance 2.0 720p и новая gemini-omni-flash, у обеих Elo 1475. Но у gemini пометка Preliminary и мало голосов, поэтому надёжнее опираться на Seedance. В пятёрку также входят две версии Grok Imagine и HappyHorse 1.0.

Чем рейтинг arena.ai отличается от Artificial Analysis?

Это две разные площадки с разными тестовыми сценами и аудиториями, поэтому абсолютные места и Elo у них не совпадают. Я держу обе и смотрю на совпадающий вывод. Разбор того же режима по Artificial Analysis у нас есть отдельной статьёй.

Почему Grok Imagine так высоко поднялся в оживлении фото?

В свежем срезе arena.ai сразу две версии Grok Imagine вошли в пятёрку, а у обычной версии рекордные для таблицы 420 тысяч голосов. Модель перестала быть только дешёвым вариантом и подтянулась по качеству движения.

На что смотреть при выборе модели для оживления фото товара?

На то, насколько бережно модель сохраняет исходник: цвет, фактуру, текст на упаковке, логотип. Арена это не оценивает, она про общую динамику. Поэтому верхушку рейтинга стоит брать как список кандидатов и проверять их на своём кадре.

Источники

  1. arena.ai: Image-to-Video Leaderboard (оригинал, английский)
  2. Artificial Analysis: Image to Video Leaderboard (оригинал, английский)

Об авторе

Артём Соколов

Обозреватель Flami

Читайте также