Сбер представил версию нейросети GPT-3, способную генерировать тексты на 61 языке мира

Сбер представила многоязычную версию нейросети GPT-3: модель под названием mGPT может генерировать тексты на 61 языке мира, включая языки народов России и стран СНГ. mGPT — это первая в мире генеративная модель, которая поддерживает такое количество языков.
Сбер представил версию нейросети GPT-3, способную генерировать тексты на 61 языке мира

Сбер представил версию нейросети GPT-3, способную генерировать тексты на 61 языке мира. Фото: Pixabay

Она доступна в двух версиях: базовой, с 1,3 миллиарда параметров, опубликованной в открытом доступе в облачном хранилище СберДиск, и расширенной, с 13 миллиардами параметров, которая скоро станет доступна на платформе машинного обучения ML Space от SberCloud.

Модель mGPT может использоваться как просто для генерации текста, так и для решения различных задач в области обработки естественного языка на одном из поддерживаемых языков путём дообучения или в составе ансамблей моделей.

Модель показывает выдающиеся результаты на многих задачах few-shot и zero-shot learning: в этой области машинного обучения не требуется отдельно доучивать модель, достаточно сформулировать задачу текстом и привести несколько примеров, после чего mGPT научится выполнять новую задачу. Это может использоваться для того, чтобы научить автоматизированную систему отвечать на вопросы, определять эмоциональную окраску текста, извлекать из текста имена, фамилии, названия компаний и т. п. Модель может также использоваться как компонент различных речевых технологий — например, для улучшения качества распознавания речи, генерации сценариев диалоговых систем и т. д.

Из сообщения Дениса Филиппова, CEO SberDevices, вице-президента по новым цифровым поверхностям Салют Сбербанка:

«В 2020 году мы представили русскоязычную версию нейросети GPT-3, именно она используется в двух виртуальных ассистентах семейства Салют от Сбера — Джой и Афине. Мы продолжили развивать наши NLP-технологии и представили модель mGPT, поддерживающую более 60 языков, при этом для многих из них ранее генеративных моделей просто не существовало. Это среди прочего станет нашим вкладом в сохранение и развитие языков народов России: mGPT умеет генерировать тексты, например, на татарском или якутском»

Русскоязычная версия GPT-3, разработанная Сбером, доступна на платформе SmartMarket.

Startpack подготовил список облачных сервисов для разработки программного обеспечения и совместной работы. В него вошли среды разработки и конструкторы для создания приложений, сайтов, чат-ботов и интернет-магазинов, решения для планирования и распределения ресурсов при работе над большими проектами, платформы для создания прототипов, общения между дизайнерами и программистами, автоматизации тестирования и проверки кода на ошибки. Система контроля версий поможет хранить старые версии ПО и наладить выпуск стабильных релизов.

Статьи по теме

Больше интересного

Актуальное

Citrix предлагает новые варианты «рабочего стола как услуги»
«Интеррос» создаст крупнейшего IT-разработчика в России
Ошибка Microsoft Defender испугала пользователей Google Chrome
Ещё…