← Все статьиОбзоры AI-моделей

Российские нейросети против западных: где Kandinsky и YandexART реально выигрывают

Артём Соколов21 июня 2026 г.Чтение займёт 3 мин
Flami blog

Российские нейросети против западных: что умеет Kandinsky 5.0 от Сбера и YandexART, где они уступают Veo и Nano Banana, а где выигрывают на задачах селлера.

Про российские нейросети обычно говорят в двух крайностях: либо «догнали и перегнали», либо «безнадёжно отстали». Я разложу спокойно, где российские нейросети против западных реально проигрывают, а где у них есть честное преимущество для нашего рынка. Без флага и без снобизма, по задачам селлера.

Что есть у нас: Kandinsky и YandexART

Главный игрок это Kandinsky 5.0 от Сбера. В ноябре 2025 года вышло целое семейство: Image Lite примерно на 6 миллиардов параметров для картинок, Video Lite около 2 миллиардов для лёгкого видео и Video Pro на 19 миллиардов для роликов в HD с управляемым движением камеры. Важная деталь: часть моделей выложена с открытыми весами под лицензией MIT, то есть их можно скачать и дообучать. Модель понимает русский и английский и аккуратно рисует кириллицу, что для упаковки и инфографики ценно. В рейтинге arena.ai среди открытых видеомоделей Kandinsky 5.0 идёт впереди, об этом я писал в разборе открытых нейросетей для видео.

Второй заметный игрок это YandexART, генератор изображений Яндекса, который живёт в сервисе Шедеврум и продуктах компании. Его сильная сторона тоже работа с русским языком и доступность внутри российской экосистемы.

Где западные пока впереди

Честно, без поблажек своим: по сырому качеству на сложных сценах глобальная верхушка пока сильнее. Veo 3.1 для премиум-видео и Nano Banana для фотореалистичных картинок в слепых рейтингах стоят выше, и на кинематографичной сцене с тонким светом разница видна. Это нормально: за ними больше вычислений и данных. Так что если задача это вау-ролик премиального бренда, я пока чаще беру глобальную модель.

Где наши реально выигрывают

А вот тут начинается интересное, и это не из вежливости. Первое и самое заметное это кириллица: русский текст на упаковке и баннере наши модели нередко держат увереннее западных, для которых кириллица экзотика. Про то, кто вообще не калечит русский текст, есть отдельный тест кириллицы в нейросетях.

Дальше доступность, и на потоке это огромный плюс: никакого VPN и зарубежной карты, оплата в рублях, работа из России без плясок с доступом, меньше нервов и времени на ровном месте.

Ну и открытость. Kandinsky под MIT можно дообучить под свой бренд на своём железе, чего с закрытыми флагманами не сделать.

Что я бы из этого взял на практике

Моя рамка простая. Под имиджевую премиум-задачу, где решает каждая деталь, пока сильнее глобальная модель. Под поток карточек с русским текстом, где важны доступность и предсказуемость, российские модели часто удобнее и дешевле в работе. Разрыв в качестве при этом сокращается быстро, Kandinsky развивается заметными шагами, так что через пару релизов сравнение может выглядеть иначе.

Глобальную верхушку для сравнения мы держим во Flami с оплатой в рублях и без VPN, так что протестировать, где разница реально критична для вашего товара, можно на своих карточках.

Часто задаваемые вопросы

Какие российские нейросети есть для картинок и видео?

Главные это Kandinsky 5.0 от Сбера, целое семейство моделей для изображений и видео, часть с открытыми весами под MIT, и YandexART от Яндекса для генерации изображений. Обе сильны в работе с русским языком и доступны из России без VPN.

Российские нейросети хуже западных?

По сырому качеству на сложных сценах глобальная верхушка вроде Veo 3.1 и Nano Banana пока впереди. Но на задачах селлера российские модели выигрывают в кириллице, доступности без VPN и открытости, а разрыв в качестве сокращается с каждым релизом.

Что такое Kandinsky 5.0?

Это семейство моделей Сбера, вышедшее в ноябре 2025 года: Image Lite для картинок, Video Lite для лёгкого видео и Video Pro на 19 миллиардов параметров для HD-роликов. Часть моделей выложена под лицензией MIT, модель понимает русский и аккуратно рисует кириллицу.

Когда стоит выбрать российскую нейросеть, а когда западную?

Под имиджевую премиум-задачу с тонкой сценой пока чаще сильнее западная модель. Под поток карточек с русским текстом, где важны доступность и оплата в рублях, удобнее российская. Под конкретный товар стоит сравнить обе на своём кадре.

Источники

  1. arXiv: Kandinsky 5.0, A Family of Foundation Models for Image and Video Generation (оригинал, английский)
  2. GitHub: kandinskylab/kandinsky-5 (оригинал, английский)

Об авторе

Артём Соколов

Обозреватель Flami

Читайте также