Tencent представила собственную большую модель Hunyuan 2.0

Китайская технологическая компания Tencent официально выпустила собственную большую языковую модель Hunyuan 2.0 (HY2.0), построенную по архитектуре «Смесь экспертов» (MoE).

Tencent представила собственную большую модель Hunyuan 2.0. Фото: Freepik

Модель насчитывает 406 млрд параметров, из которых активно используются 32 млрд, и поддерживает сверхдлинное контекстное окно в 256 тыс. токенов. Одновременно Tencent начала постепенную интеграцию сторонней модели DeepSeek V3.2 в свою экосистему, и обе модели уже запущены в таких собственных сервисах компании, как Yuanbao и ima, а также доступны через Tencent Cloud в формате API.

Новая версия HY2.0Think демонстрирует значительный прогресс в области логических рассуждений благодаря улучшенным стратегиям предварительного обучения и обучения с подкреплением. Модель показывает конкурентоспособные результаты в сложных сценариях, включая математику, естественные науки, программирование и выполнение многошаговых инструкций. В частности, она достигла высоких показателей в авторитетных тестах, таких как Международная математическая олимпиада (IMO-AnswerBench) и Математический конкурс Гарвардского технологического института (HMMT2025).

Для оптимизации работы с длинными текстами и многовариантными задачами в HY2.0Think применены методы коррекции выборки по важности, что устраняет разрыв между обучением и инференсом. Также модель прошла специализированную подготовку в верифицируемых средах с использованием синтетических данных, что улучшило её практические возможности в сценариях агентного программирования и работы со сложными инструментами, включая тесты SWE-bench Verified и Tau2-Bench. Эти улучшения укрепляют позиции Tencent на быстрорастущем рынке корпоративных ИИ-решений.