Tencent представила собственную большую модель Hunyuan 2.0
Tencent представила собственную большую модель Hunyuan 2.0. Фото: Freepik
Модель насчитывает 406 млрд параметров, из которых активно используются 32 млрд, и поддерживает сверхдлинное контекстное окно в 256 тыс. токенов. Одновременно Tencent начала постепенную интеграцию сторонней модели DeepSeek V3.2 в свою экосистему, и обе модели уже запущены в таких собственных сервисах компании, как Yuanbao и ima, а также доступны через Tencent Cloud в формате API.
Новая версия HY2.0Think демонстрирует значительный прогресс в области логических рассуждений благодаря улучшенным стратегиям предварительного обучения и обучения с подкреплением. Модель показывает конкурентоспособные результаты в сложных сценариях, включая математику, естественные науки, программирование и выполнение многошаговых инструкций. В частности, она достигла высоких показателей в авторитетных тестах, таких как Международная математическая олимпиада (IMO-AnswerBench) и Математический конкурс Гарвардского технологического института (HMMT2025).
Для оптимизации работы с длинными текстами и многовариантными задачами в HY2.0Think применены методы коррекции выборки по важности, что устраняет разрыв между обучением и инференсом. Также модель прошла специализированную подготовку в верифицируемых средах с использованием синтетических данных, что улучшило её практические возможности в сценариях агентного программирования и работы со сложными инструментами, включая тесты SWE-bench Verified и Tau2-Bench. Эти улучшения укрепляют позиции Tencent на быстрорастущем рынке корпоративных ИИ-решений.
Упомянутый сервис
Комментариев пока не было