Рейтинг AI-видео: бенчмарк Artificial Analysis

Разбираем на русском данные Artificial Analysis Video Arena: кто лидер среди AI-видеомоделей, как считается рейтинг и что это значит на практике.

Это перевод и разбор данных независимого бенчмарка Artificial Analysis Video Arena на русском. Оригинал и актуальные цифры (они меняются почти каждую неделю): Artificial Analysis Video Arena. Мы пересказываем интересный материал, но за свежими значениями всегда идите в первоисточник.

Когда вендор пишет в анонсе «наша модель лучшая», верить на слово смысла нет, это маркетинг. Поэтому я ориентируюсь не на анонсы, а на независимые замеры. Самый показательный для видео сейчас, на мой взгляд, Artificial Analysis. Расскажу, как он устроен и что показывает на май 2026-го.

Как там вообще считают

Artificial Analysis не ставит оценки «от экспертов». Они показывают людям два ролика по одному и тому же запросу, не говоря, какая модель что сгенерировала, и человек выбирает, что лучше. По итогам тысяч таких слепых сравнений считается Elo-рейтинг, та же система, что в шахматах.

Это честнее, чем синтетические метрики, потому что меряет именно человеческое восприятие: что зрителю кажется убедительнее. Минус тоже есть: побеждает «вообще красивее», а не «лучше под конкретную задачу». Об этом ниже.

Кто наверху

На конец апреля 2026-го верхние строчки держат две модели: Seedance 2.0 от ByteDance и HappyHorse 1.0 от Alibaba ATH.

Если смотреть отдельно по дисциплинам, картина такая:

| Дисциплина | Кто впереди | |---|---| | Text-to-video (без звука) | HappyHorse 1.0, заметный отрыв (Elo около 1357) | | Image-to-video (без звука) | HappyHorse 1.0 | | Со звуком | HappyHorse и Seedance почти вровень (примерно 1212 против 1213) |

То есть называть однозначного «короля» некорректно. Без звука увереннее HappyHorse, со звуком они с Seedance идут ноздря в ноздрю. Цифры привожу по Artificial Analysis, на момент, когда я смотрел.

А где же Veo, Kling, Hailuo

Из-за этого бенчмарк часто понимают неправильно.

Veo 3.1, Kling 3.0 и Hailuo в общем зачёте идут ниже топ-2. Но это не значит, что они «хуже» для вашей задачи. Бенчмарк берёт случайные промпты и смотрит, что зрителю в среднем нравится больше. У каждой своя сильная зона. Veo тащит премиум-свет и кино-картинку. Kling берёт динамикой. А Hailuo лучше всех справляется с мимикой и эмоциями крупным планом.

Я сам не раз видел, как модель из середины рейтинга делает конкретную задачу лучше формального лидера. Так что строчка в таблице мало что говорит про вашу сцену.

Что с этого селлеру

Не выбирайте модель по строчке в рейтинге. Выбирайте под задачу.

Нужен максимально убедительный ролик «вообще», без привязки к нюансам, начните с лидеров (Seedance 2.0, HappyHorse 1.0). Нужна эмоция, премиум или конкретная физика, смотрите профильную модель, даже если в общем зачёте она ниже. У нас во Flami все эти модели в одной подписке, так что можно собрать одну сцену в нескольких и сравнить результат самому.

Источник

Artificial Analysis: Video Arena Leaderboard (оригинал, английский)

Какие AI-видеомодели реально лучшие в 2026: разбираем бенчмарк Artificial Analysis

Как там вообще считают

Кто наверху

А где же Veo, Kling, Hailuo

Что с этого селлеру

Источник

Получите 15 кредитов бесплатно