В Alibaba представили модель ИИ «рассуждения» QwQ-32B-Preview
В Alibaba представили модель ИИ «рассуждения» QwQ-32B-Preview. Фото: из архива компании
Разработанная командой Qwen из Alibaba, модель QwQ-32B-Preview содержит 32,5 млрд параметров и может рассматривать подсказки длиной около 32 тыс. слов; на некоторых тестах она работает лучше, чем o1-preview и o1-mini — две модели рассуждений, которые OpenAI выпустила на данный момент. (Параметры примерно соответствуют навыкам решения проблем модели, а модели с большим количеством параметров, как правило, работают лучше, чем модели с меньшим количеством параметров. OpenAI не раскрывает количество параметров для своих моделей.)
Согласно тестированию Alibaba, QwQ-32B-Preview превосходит модели OpenAI o1 на тестах AIME и MATH. AIME использует другие модели ИИ для оценки производительности модели, тогда как MATH представляет собой набор текстовых задач.
QwQ-32B-Preview может решать логические головоломки и отвечать на достаточно сложные математические вопросы благодаря своим возможностям «рассуждения». Но он не идеален. Представитель Alibaba отмечает в сообщении в блоге , что модель может неожиданно переключать языки, «застревать» в циклах и плохо справляться с задачами, требующими «здравого смысла».
В отличие от большинства ИИ, QwQ-32B-Preview и другие модели рассуждений эффективно проверяют факты сами. Это помогает им избегать некоторых ловушек, которые обычно мешают моделям, а недостатком является то, что им часто требуется больше времени, чтобы прийти к решениям. Подобно o1, QwQ-32B-Preview рассуждает о задачах, планируя заранее и выполняя ряд действий, которые помогают модели выдавать ответы.
QwQ-32B-Preview «открыто» доступна по лицензии Apache 2.0. Инструмент можно использовать для коммерческих приложений.
Комментариев пока не было