Российские нейросети против западных: где Kandinsky и YandexART реально выигрывают

Российские нейросети против западных: что умеет Kandinsky 5.0 от Сбера и YandexART, где они уступают Veo и Nano Banana, а где выигрывают на задачах селлера.
Про российские нейросети обычно говорят в двух крайностях: либо «догнали и перегнали», либо «безнадёжно отстали». Я разложу спокойно, где российские нейросети против западных реально проигрывают, а где у них есть честное преимущество для нашего рынка. Без флага и без снобизма, по задачам селлера.
Что есть у нас: Kandinsky и YandexART
Главный игрок это Kandinsky 5.0 от Сбера. В ноябре 2025 года вышло целое семейство: Image Lite примерно на 6 миллиардов параметров для картинок, Video Lite около 2 миллиардов для лёгкого видео и Video Pro на 19 миллиардов для роликов в HD с управляемым движением камеры. Важная деталь: часть моделей выложена с открытыми весами под лицензией MIT, то есть их можно скачать и дообучать. Модель понимает русский и английский и аккуратно рисует кириллицу, что для упаковки и инфографики ценно. В рейтинге arena.ai среди открытых видеомоделей Kandinsky 5.0 идёт впереди, об этом я писал в разборе открытых нейросетей для видео.
Второй заметный игрок это YandexART, генератор изображений Яндекса, который живёт в сервисе Шедеврум и продуктах компании. Его сильная сторона тоже работа с русским языком и доступность внутри российской экосистемы.
Где западные пока впереди
Честно, без поблажек своим: по сырому качеству на сложных сценах глобальная верхушка пока сильнее. Veo 3.1 для премиум-видео и Nano Banana для фотореалистичных картинок в слепых рейтингах стоят выше, и на кинематографичной сцене с тонким светом разница видна. Это нормально: за ними больше вычислений и данных. Так что если задача это вау-ролик премиального бренда, я пока чаще беру глобальную модель.
Где наши реально выигрывают
А вот тут начинается интересное, и это не из вежливости. Первое и самое заметное это кириллица: русский текст на упаковке и баннере наши модели нередко держат увереннее западных, для которых кириллица экзотика. Про то, кто вообще не калечит русский текст, есть отдельный тест кириллицы в нейросетях.
Дальше доступность, и на потоке это огромный плюс: никакого VPN и зарубежной карты, оплата в рублях, работа из России без плясок с доступом, меньше нервов и времени на ровном месте.
Ну и открытость. Kandinsky под MIT можно дообучить под свой бренд на своём железе, чего с закрытыми флагманами не сделать.
Что я бы из этого взял на практике
Моя рамка простая. Под имиджевую премиум-задачу, где решает каждая деталь, пока сильнее глобальная модель. Под поток карточек с русским текстом, где важны доступность и предсказуемость, российские модели часто удобнее и дешевле в работе. Разрыв в качестве при этом сокращается быстро, Kandinsky развивается заметными шагами, так что через пару релизов сравнение может выглядеть иначе.
Глобальную верхушку для сравнения мы держим во Flami с оплатой в рублях и без VPN, так что протестировать, где разница реально критична для вашего товара, можно на своих карточках.
Часто задаваемые вопросы
Какие российские нейросети есть для картинок и видео?
Главные это Kandinsky 5.0 от Сбера, целое семейство моделей для изображений и видео, часть с открытыми весами под MIT, и YandexART от Яндекса для генерации изображений. Обе сильны в работе с русским языком и доступны из России без VPN.
Российские нейросети хуже западных?
По сырому качеству на сложных сценах глобальная верхушка вроде Veo 3.1 и Nano Banana пока впереди. Но на задачах селлера российские модели выигрывают в кириллице, доступности без VPN и открытости, а разрыв в качестве сокращается с каждым релизом.
Что такое Kandinsky 5.0?
Это семейство моделей Сбера, вышедшее в ноябре 2025 года: Image Lite для картинок, Video Lite для лёгкого видео и Video Pro на 19 миллиардов параметров для HD-роликов. Часть моделей выложена под лицензией MIT, модель понимает русский и аккуратно рисует кириллицу.
Когда стоит выбрать российскую нейросеть, а когда западную?
Под имиджевую премиум-задачу с тонкой сценой пока чаще сильнее западная модель. Под поток карточек с русским текстом, где важны доступность и оплата в рублях, удобнее российская. Под конкретный товар стоит сравнить обе на своём кадре.
Источники
- arXiv: Kandinsky 5.0, A Family of Foundation Models for Image and Video Generation (оригинал, английский)
- GitHub: kandinskylab/kandinsky-5 (оригинал, английский)
Об авторе
Артём Соколов
Обозреватель Flami
Читайте также
Тёмные лошадки 2026: пять недооценённых нейросетей, которые зря обходят стороной
Как видео в карточке поднимает конверсию: разбираю цифры, которым можно верить, и которым нельзя
Как алгоритмы Wildberries и Ozon ранжируют карточки в 2026: что реально двигает товар вверх, а что мифы
Сколько стоит AI-видео против студийной съёмки: посчитал на реальных цифрах для селлера