← Все статьиИнтересные исследования

Grok Imagine от xAI: что заявили разработчики о самой быстрой генерации

Артём Соколов18 мая 2026 г.Чтение займёт 3 мин

Русский разбор материалов xAI о Grok Imagine: ролик за секунды со звуком, 480p и 720p, цены посекундно и честно про слабые места модели.

Это перевод и разбор материалов xAI о Grok Imagine на русском. Оригинал: Grok Imagine, xAI's new AI image and video generator. Пересказываем интересное, цифры сверяйте с первоисточником.

В августе 2025 года xAI выкатила Grok Imagine, генератор изображений и видео от компании Илона Маска. Главный акцент анонса не на красоте кадра, а на скорости: ролик готов за секунды, а не минуты. Разберём, что заявлено, без маркетингового тумана.

Скорость и объём, ради которых всё затевалось

Большинство топовых видеомоделей думают над роликом минутами. Grok Imagine, по описанию, выдаёт результат почти мгновенно. TechCrunch в обзоре отметил, что генератор выдаёт картинки за секунды из текстового промпта и продолжает докидывать новые, пока листаешь выдачу. С видео логика та же, только чуть дольше.

Связка проста: скорость плюс объём. Когда нужно за один присест накидать десятки вариантов под разные SKU и понять, какой движется в нужную сторону, такая модель сжимает цикл «придумал, увидел, поправил» до состояния, когда не теряешь мысль между итерациями.

Что заявлено по фактам из документации

В документации xAI по Imagine API перечислено, что умеет модель:

  • видео из текста или из картинки, исходное фото становится первым кадром,
  • длительность ролика до 15 секунд,
  • reference-to-video, когда сцена задаётся референсными картинками без привязки первого кадра,
  • video extension, продолжение готового ролика с последнего кадра,
  • редактирование уже сгенерированного видео текстом,
  • нативный звук в том же проходе, без отдельной аудиосборки.

Разрешение по API скромное: указаны 480p и 720p, не 4K. Цена считается посекундно: $0.05 за секунду на 480p и $0.07 на 720p. То есть шестисекундный ролик в 720p выходит примерно в сорок с небольшим центов.

Честно про слабые места

Раз уж это разбор, а не реклама, скажем прямо. Качество картинки тут не топ. TechCrunch в обзоре отметил, что люди в кадре получаются с восковой кожей и местами уходят в uncanny valley, эффект зловещей долины. Крупные планы лиц и мелкая мимика плывут, для эмоционального портрета модель брать не стоит.

Потолок качества тоже виден: 720p хватает на соцсети и черновики, но для премиум-ролика, где зритель разглядывает фактуру ткани, маловато. И ещё момент: у Grok Imagine есть так называемый spicy mode, генерация откровенного контента. На брендовых задачах это скорее сигнал, что фильтры тут расслабленные и за выдачей надо следить.

Цитата из анонса

При запуске сам Маск написал в X, что модель будет:

«get better every day» — Илон Маск, по материалам TechCrunch

То есть ставка на скорость итераций заложена не только в саму генерацию, но и в темп обновлений: версия v0.9 подъехала уже через несколько дней после запуска, дальше пошёл публичный API.

Что это значит на практике

Grok Imagine не про один идеальный ролик, а про то, чтобы сделать сорок неидеальных и быстро понять, какой стоит переснять на модели посерьёзнее. Её зона это массовый объём черновиков, тесты гипотез и вертикальные клипы со звуком, а вот крупные планы лиц и премиум-картинку лучше отдавать другим инструментам.

Подробно, с тестами руками и табличкой задач, в обзоре Grok Imagine.

Попробовать Grok Imagine в рублях без VPN можно во Flami.

Источники

  1. TechCrunch: Grok Imagine, xAI's new AI image and video generator (оригинал, английский)
  2. xAI Docs: Imagine — API capabilities, pricing, resolution (оригинал, английский)
  3. xAI: главная страница компании (оригинал, английский)

Об авторе

Артём Соколов

Обозреватель Flami