← Все статьиИнтересные исследования

Какие AI-видеомодели реально лучшие в 2026: разбираем бенчмарк Artificial Analysis

Артём Соколов8 мая 2026 г.Чтение займёт 2 мин

Разбираем на русском данные Artificial Analysis Video Arena: кто лидер среди AI-видеомоделей, как считается рейтинг и что это значит на практике.

Это перевод и разбор данных независимого бенчмарка Artificial Analysis Video Arena на русском. Оригинал и актуальные цифры (они меняются почти каждую неделю): Artificial Analysis Video Arena. Мы пересказываем интересный материал, но за свежими значениями всегда идите в первоисточник.

Когда вендор пишет в анонсе «наша модель лучшая», верить на слово смысла нет, это маркетинг. Поэтому я ориентируюсь не на анонсы, а на независимые замеры. Самый показательный для видео сейчас, на мой взгляд, Artificial Analysis. Расскажу, как он устроен и что показывает на май 2026-го.

Как там вообще считают

Artificial Analysis не ставит оценки «от экспертов». Они показывают людям два ролика по одному и тому же запросу, не говоря, какая модель что сгенерировала, и человек выбирает, что лучше. По итогам тысяч таких слепых сравнений считается Elo-рейтинг, та же система, что в шахматах.

Это честнее, чем синтетические метрики, потому что меряет именно человеческое восприятие: что зрителю кажется убедительнее. Минус тоже есть: побеждает «вообще красивее», а не «лучше под конкретную задачу». Об этом ниже.

Кто наверху

На конец апреля 2026-го верхние строчки держат две модели: Seedance 2.0 от ByteDance и HappyHorse 1.0 от Alibaba ATH.

Если смотреть отдельно по дисциплинам, картина такая:

| Дисциплина | Кто впереди | |---|---| | Text-to-video (без звука) | HappyHorse 1.0, заметный отрыв (Elo около 1357) | | Image-to-video (без звука) | HappyHorse 1.0 | | Со звуком | HappyHorse и Seedance почти вровень (примерно 1212 против 1213) |

То есть называть однозначного «короля» некорректно. Без звука увереннее HappyHorse, со звуком они с Seedance идут ноздря в ноздрю. Цифры привожу по Artificial Analysis, на момент, когда я смотрел.

А где же Veo, Kling, Hailuo

Вот тут важный момент, из-за которого бенчмарк часто понимают неправильно.

Veo 3.1, Kling 3.0 и Hailuo в общем зачёте идут ниже топ-2. Но это не значит, что они «хуже» для вашей задачи. Бенчмарк меряет усреднённое предпочтение по случайным промптам. А у каждой модели своя сильная зона: Veo вытягивает премиум-свет и кино-картинку, Kling динамику, Hailuo мимику и эмоции крупным планом.

Я сам не раз видел, как модель из середины рейтинга делает конкретную задачу лучше формального лидера. Так что рейтинг это ориентир, а не приговор.

Что с этого селлеру

По-простому: не выбирайте модель по строчке в рейтинге. Выбирайте под задачу.

Нужен максимально убедительный ролик «вообще», без привязки к нюансам, начните с лидеров (Seedance 2.0, HappyHorse 1.0). Нужна эмоция, премиум или конкретная физика, смотрите профильную модель, даже если в общем зачёте она ниже. У нас во Flami все эти модели в одной подписке, так что можно прогнать одну сцену через две-три и выбрать глазами. Это, честно, надёжнее любого рейтинга.

Источник

  1. Artificial Analysis: Video Arena Leaderboard (оригинал, английский)

Об авторе

Артём Соколов

Обозреватель Flami