← Все статьиГайды для селлеров

Почему нейросети калечат руки, текст и логотипы и как это обойти: 7 рабочих приёмов

Марина Лебедева18 июня 2026 г.Чтение займёт 3 мин
Flami blog

Почему нейросети калечат руки, текст и логотипы на картинках и в видео, и 7 рабочих приёмов, как получить чистый кадр для карточки товара без брака.

Шесть пальцев, надпись из инопланетного алфавита, чужой логотип на футболке модели. Если вы хоть раз генерировали картинки для товара, вы это видели. Расскажу, почему нейросети калечат руки и текст, без мистики, на пальцах, и дам семь приёмов, которыми я сама вытаскиваю чистый кадр для карточки.

Почему так вообще выходит

Модель не понимает, что рука это пять пальцев, а слово это буквы в строгом порядке. Она собирает картинку из вероятностей: что обычно бывает рядом с чем. Рука бывает в сотнях положений, пальцы перекрывают друг друга, и на стыке вероятностей модель легко добавляет лишний или гнёт сустав не туда. С текстом то же самое: для генератора буквы это узор, а не смысл, поэтому он рисует похожий на текст орнамент, особенно на незнакомой ему кириллице.

Логотипы отдельная история. Модель насмотрелась брендов в обучении и любит подрисовать на одежду или упаковку что-то знакомое. Для карточки это прямой риск: чужой логотип в кадре это отклонение на модерации маркетплейса.

Где ломается чаще всего

Руки и пальцы, особенно когда модель держит товар. Текст на упаковке и в инфографике, тем более русский. Мелкая повторяющаяся фактура: цепочки, зубцы, решётки, где модель сбивается со счёта. Отражения и блики на глянце и стекле. Чужие логотипы, которые модель дорисовывает сама.

Чем я чищу кадр

Берите модель под задачу. Если в кадре много текста, сразу идите к моделям, которые умеют буквы: Ideogram 3.0 для текста в кадре и GPT Image 2 для макетов и надписей, про них я писала в обзоре Ideogram 3.0 и обзоре GPT Image 2. С кириллицей отдельно сильны Qwen Image 2.0 и Z-Image, подробный тест в материале про кириллицу в нейросетях.

Негативный промпт. Где модель его поддерживает, прямо перечислите, чего быть не должно: лишние пальцы, искажённый текст, водяные знаки, посторонние логотипы. Это не панацея, но заметную часть брака отсекает.

Ещё момент с руками: не загоняйте их в сложные позы. Если можно показать товар без хвата за мелкую деталь, покажите. Чем проще положение руки, тем меньше шансов на шестой палец.

Текст добавляйте отдельно. Самый надёжный способ получить идеальную надпись: генерировать чистый фон нейросетью, а текст накладывать в редакторе. Модель рисует картинку, буквы ставит человек.

Крупный план для фактуры. Мелкие повторяющиеся детали модель путает на общем плане. Дайте ей крупный кадр, где зубцов или звеньев немного, и собирайте композицию из таких фрагментов.

Итерации по одному параметру. Не переписывайте промпт целиком после неудачи. Поменяйте одно: положение руки, ракурс, формулировку про текст, и перегенерируйте. Так понятно, что именно сработало.

И самое скучное, оно же самое рабочее: просто посмотрите на кадр перед загрузкой. Половина проблем решается этим. Шесть пальцев и чужой логотип видно сразу, если приглядеться.

Flami blog

Прогнать одну сцену через несколько моделей и забрать кадр без шестого пальца во Flami это минутное дело: модели с чистыми руками и текстом там уже отобраны.

Часто задаваемые вопросы

Почему нейросеть рисует лишние пальцы?

Модель не считает пальцы, а собирает руку из вероятных форм. В сложных позах, где пальцы перекрывают друг друга или держат предмет, она легко добавляет лишний или гнёт сустав. Простое положение руки и крупный план снижают риск.

Почему текст на картинке от нейросети получается кривым?

Для генератора буквы это узор, а не смысл, поэтому он рисует нечто похожее на текст. С русским хуже, чем с латиницей, потому что кириллицы в обучении было меньше. Надёжнее брать модели, заточенные под текст, или накладывать надпись отдельно в редакторе.

Как убрать чужие логотипы из кадра?

Добавьте запрет на посторонние логотипы в негативный промпт и проверяйте кадр перед загрузкой. Чужой бренд на одежде или упаковке это риск отклонения на модерации маркетплейса, поэтому такие кадры лучше перегенерировать.

Можно ли вообще доверять нейросети текст на упаковке?

С осторожностью. Даже сильные в тексте модели иногда промахиваются, особенно на кириллице. Для ответственных надписей самый надёжный путь: чистый фон от нейросети плюс текст, наложенный человеком в редакторе.

Источники

  1. Flami: кириллица в нейросетях для картинок
  2. Flami: инфографика и текст на картинке товара

Об авторе

Марина Лебедева

Обозреватель Flami

Читайте также