Сбер представляет Kandinsky 4.1 Video— качественный скачок в генерации видео по тексту

Сбер представляет Kandinsky 4.1 Video— качественный скачок в генерации видео по тексту

Сбер активно развивает свою генеративную нейросеть Kandinsky и в самое ближайшее время выпустит новую версию для генерации видео Kandinsky 4.1 Video. Первые доступы к Kandinsky 4.1 Video уже получили участники GigaConf, а также некоторые художники и дизайнеры. В ближайшем будущем она будет доступна всем пользователям. Об этом заявил старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев в рамках технологической конференции GigaConf.

Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка:

«Kandinsky 4.1 Video обеспечивает качественно новый уровень генеративного видео. Модель стала в разы лучше по всем параметрам: по соответствию промпту, визуальному качеству, качеству генерации движений, а также способности моделировать физику мира. Такие разработки открывают беспрецедентные возможности как для дизайнеров, маркетологов, так и для представителей любых других креативных индустрий, работающих над созданием высококачественного видеоконтента».

Модель Kandinsky 4.1 Video генерирует видеоряд продолжительностью до 10 секунд в разрешении SD (720x576) или HD (1280x720) по любому текстовому описанию или произвольному стартовому кадру. С помощью модели можно создавать качественные видео с произвольным соотношением сторон под любые пользовательские и продуктовые потребности.

В основе новой модели лежит продвинутая архитектура диффузионного трансформера. Одним из ключевых факторов, позволивших значительно улучшить качество модели, стало её дообучение (Supervised Fine-Tuning, SFT) на тщательно отобранных данных, подготовленных более, чем100 экспертами — дизайнерами, фотографами и художниками с профильным образованием. Этот этап обучения позволил значительно повысить уровень художественной выразительности, композиции видео и кинематографичности визуального ряда.

Переход к новой большой архитектуре заметно увеличил потребность в вычислительных ресурсах, поэтому при разработке уделялось особое внимание оптимизации. В результате применения методов дистилляции и ускорения, время генерации видео сократилось более чем в три раза по сравнению с исходным вариантом, при этом в ряде сценариев качество генерации сохранилось или даже улучшилось.

Напомним, что первая в России модель генерации видео Kandinsky Video была представлена 22 ноября 2023 года на конференции AI Journey.

Источник: "Вести:Приморье" [ www.vestiprim.ru ]
«Вести: Приморье» в Telegram и MAX — подпишитесь на самые актуальные и интересные новости!
  • Эксперты из 15 стран обсудили перспективы развития искусственного интеллекта на региональной сессии конференции AI Journey

    17.06.2025 15:56
  • Внедрение продуктов на основе генеративного искусственного интеллекта стало проще, чем сама разработка

    8.07.2024 10:20
  • Карту Сбера с уникальным дальневосточным дизайном можно оформить на выставке-форуме «Россия»

    7.03.2024 12:26
  • Герман Греф: через два-три года искусственным интеллектом будет пользоваться каждая семья

    6.03.2024 11:27
  • Сбер проведёт сессию международной конференции «AI Journey: путешествие в мир искусственного интеллекта» на Всемирном фестивале молодёжи

    4.03.2024 10:48
  • Сбер на выставке «Россия»: мультисенсорный, яркий, устремлённый в будущее

    3.11.2023 11:06
  • Сбер усовершенствовал GigaChat — качество ответов значительно улучшилось

    23.10.2023 14:45
  • Сбер открыл доступ к модели генерации текста для русского языка ruGPT-3.5

    25.07.2023 13:47
  • Сбер запустил аренду банкоматов

    17.05.2023 12:24
  • Март для Сбера стал лучшим месяцем с начало года

    14.04.2023 09:30
  • Информация

    Комментировать статьи на сайте возможно только в течении 90 дней со дня публикации.