Ideogram 3.0: что сама компания заявила про текст и типографику в кадре
Русский разбор Ideogram 3.0: читаемый текст в кадре, контроль композиции, Style References и Style Code, три режима генерации. Честно о минусах.
Это перевод и разбор материалов Ideogram о версии 3.0 на русском. Оригинал: Ideogram 3.0 — Realism, design, and consistent styles. Пересказываем интересное, цифры сверяйте с первоисточником.
Ideogram 3.0 вышла в марте 2025-го, и это та редкая картиночная модель, которую строили не вокруг «нарисуй красиво», а вокруг текста в кадре. Разберу, что заявляет сама компания, без маркетингового тумана.
Главное обещание: читаемый текст
Ideogram занимается типографикой с первой версии, и VentureBeat ещё на ранних релизах писал, что модель уверенно бодается с конкурентами именно за счёт надписей. Третья версия это не косметика поверх старого, а заметный скачок по реализму и точности текста.
Вот как они описывают модель сами:
«Our most capable model yet. Photorealistic images, legible text, and precise style control in a single generation.» — Ideogram, страница 3.0
«Legible text» тут ключевое. Читаемый текст. Звучит банально, пока ты не пробовал собрать баннер с акцией в десяти других моделях и не получил вместо «СКИДКА» что-то вроде «СКДИАК». По заявлению компании, 3.0 тянет сложные и длинные текстовые композиции, с которыми другие модели не справляются: постеры с несколькими блоками, обложки, афиши.
Что ещё в материалах
- Контроль композиции и стиля. Через Style References можно загрузить до трёх своих картинок, и модель подхватит их палитру, манеру рендера и общий настрой. Удобно для серии баннеров в одном фирменном виде.
- Style Code и библиотека пресетов. Если своего референса нет, есть случайный стиль из библиотеки 4,3 миллиарда пресетов, а понравившийся можно зафиксировать через Style Code и переиспользовать.
- Три режима. Turbo под перебор вариантов, Balanced как баланс скорости и качества, Quality под финал и печать. Разрешение до 2K, все ходовые форматы.
Цифры, которые называет компания
По собственным человеческим оценкам Ideogram, в ELO-рейтинге на разнообразных промптах 3.0 идёт первой с результатом 1132, дальше с заметным отрывом Imagen 3 (1023) и остальные. Важная оговорка: это внутренний бенчмарк вендора, а не независимый, так что относиться к нему стоит со здоровым скепсисом. Производитель меряет сам себя.
Что это значит на практике
Звучит сильно, но я проверяю руками. По латинице Ideogram действительно чемпион, а вот по кириллице аккуратнее многих, но осечки на длинных фразах и редких шрифтах бывают, так что критичную русскую надпись я всегда проверяю глазами и закладываю пару лишних попыток. Чистый фотореализм флакона со стеклом тоже не её конёк, тут я чаще иду в другие модели. Ideogram сильна там, где есть текст и дизайн.
Подробно, где она лучшая, а где я её обхожу, в обзоре Ideogram 3.0. Если коротко: её корона это читаемый текст, баннеры и упаковка с надписями.
Попробовать Ideogram 3.0 в рублях без VPN можно во Flami.
Источники
- Ideogram 3.0 — Realism, design, and consistent styles (оригинал, английский)
- VentureBeat: Watch out, Midjourney! Ideogram launches AI image generator with impressive typography (оригинал, английский)
Об авторе
Марина Лебедева
Обозреватель Flami