Imagen 4 от Google DeepMind: что заявили в официальном анонсе
Русский разбор официального анонса Imagen 4 от Google DeepMind: фотореализм до 2K, чёткая типографика, метка SynthID и семейство Fast, Flagship и Ultra.
Это перевод и разбор официального анонса Imagen 4 (Google DeepMind) на русском. Оригинал: страница Imagen на сайте Google DeepMind. Пересказываем интересное, цифры сверяйте с первоисточником.
В мае 2025-го Google DeepMind показала Imagen 4 на конференции Google I/O, а в августе модель вышла в общий доступ через Gemini API вместе с версией Fast. Делает её та же лаборатория, что собрала Gemini. Разберу, что заявили сами разработчики, без розовых очков.
Главное обещание: фотореализм и резкость
Основной акцент анонса не на «красивости», а на достоверности кадра и скорости генерации. DeepMind описывает модель так.
«Imagen 4 это наша лучшая на сегодня модель текст-в-картинку, с фотореалистичными изображениями, скоростью почти в реальном времени и более высокой резкостью.» — Google DeepMind, страница Imagen
Перевод вольный, но суть передаёт. Упор на фактуру материалов: ткань, капли воды, шерсть, и на то, чтобы картинка читалась как настоящая съёмка, а не как генерация.
Что ещё в анонсе
- Разрешение до 2K. В Imagen 4 и Ultra, это подтверждено в анонсе общей доступности семейства. Для карточки маркетплейса с запасом, для печатного баннера тоже хватит.
- Чёткая типографика. Google целенаправленно докручивал рендер текста, надписи мелким шрифтом на постере читаются. С латиницей особенно хорошо.
- Метка SynthID. В каждое изображение зашивается невидимая цифровая метка, которая позволяет программно подтвердить AI-происхождение кадра. Глазом её не видно, картинку она не портит.
Семейство из трёх версий
Линейка делится на три варианта, и по официальным ценам Gemini API видно логику разделения:
- Imagen 4 Fast скоростная, картинка примерно за 2,7 секунды, под перебор вариантов и объём.
- Imagen 4 Flagship основная рабочая, баланс качества и скорости.
- Imagen 4 Ultra максимальная точность следования промпту, работает дольше, под финальные кадры.
Отдельно TechCrunch отметил, что модель хорошо тянет мелкие детали и фактуру, на продуктовой съёмке это видно сразу.
Честно про слабые места
Анонс есть анонс, но по практике есть нюансы. Латиницу Imagen рендерит отлично, а вот кириллица бывает нестабильна: лишняя буква, кривой символ, слипшиеся слова. Когда на кадре главное русский слоган, надёжнее уйти в другую модель. Стерильность это и сила, и слабость разом: для каталожного hero-кадра идеально, а для lifestyle с эмоцией модель бывает суховата.
Что это значит на практике
Я разобрала Imagen 4 руками и описала, где она реально лучшая, а где я её откладываю. Подробно в обзоре Imagen 4. Если коротко: её корона это стерильная студийная картинка, честная фактура материалов и латинская типографика.
Попробовать Imagen 4 в рублях без VPN можно во Flami.
Источники
- Google DeepMind: Imagen (оригинал, английский)
- Google Developers Blog: Announcing Imagen 4 Fast and the general availability of the Imagen 4 family (оригинал, английский)
- TechCrunch: Imagen 4 is Google's newest AI image generator (оригинал, английский)
Об авторе
Марина Лебедева
Обозреватель Flami