Z-Image от Alibaba Tongyi Lab: качество дорогих моделей на лёгкой архитектуре
Русский разбор работы Alibaba Tongyi Lab о Z-Image: суб-секундная генерация на 6B параметрах, сильная кириллица, версии Turbo и Base, открытые веса.
Русские разборы анонсов, бенчмарков и исследований AI-моделей генерации видео и изображений
10 статей
Русский разбор работы Alibaba Tongyi Lab о Z-Image: суб-секундная генерация на 6B параметрах, сильная кириллица, версии Turbo и Base, открытые веса.
Русский разбор материалов Qwen (Alibaba) о Qwen Image 2.0: единая модель генерации и редактирования, сильный текст и кириллица, открытая лицензия Apache 2.0.
Русский разбор официального анонса Seedream 5.0 Lite от ByteDance Seed: поиск в интернете при генерации, фотореализм, кириллица и серийная съёмка.
Русский разбор анонса GPT Image 2 (ChatGPT Images 2.0) от OpenAI: режим мышления, онлайн-поиск фактов, точный текст и мультиязычность до 2K.
Русский разбор Ideogram 3.0: читаемый текст в кадре, контроль композиции, Style References и Style Code, три режима генерации. Честно о минусах.
Русский разбор официального анонса Imagen 4 от Google DeepMind: фотореализм до 2K, чёткая типографика, метка SynthID и семейство Fast, Flagship и Ultra.
Русский разбор материалов xAI о Grok Imagine: ролик за секунды со звуком, 480p и 720p, цены посекундно и честно про слабые места модели.
Русский разбор материалов о HappyHorse 1.0 от Alibaba ATH: первое место в text-to-video без звука, сильная детализация предметки и честно про закрытые веса.
Русский разбор официального анонса Seedance 2.0 от ByteDance: видео и звук в одной генерации, нативный UGC, топ Artificial Analysis и честно про слабые места.
Русский разбор официального анонса Hailuo 2.3 от MiniMax: точнее мимика и микровыражения, физика тела, стили аниме и ink-wash, Media Agent, 1080p.