В Alibaba представили модель ИИ «рассуждения» QwQ-32B-Preview

Разработчики из Alibaba представили модель ИИ «рассуждения» QwQ-32B-Preview. Она одна из немногих, способных конкурировать с o1 от OpenAI, и первая, доступная для загрузки по разрешительной лицензии.
В Alibaba представили модель ИИ «рассуждения» QwQ-32B-Preview

В Alibaba представили модель ИИ «рассуждения» QwQ-32B-Preview. Фото: из архива компании

Разработанная командой Qwen из Alibaba, модель QwQ-32B-Preview содержит 32,5 млрд параметров и может рассматривать подсказки длиной около 32 тыс. слов; на некоторых тестах она работает лучше, чем o1-preview и o1-mini — две модели рассуждений, которые OpenAI выпустила на данный момент. (Параметры примерно соответствуют навыкам решения проблем модели, а модели с большим количеством параметров, как правило, работают лучше, чем модели с меньшим количеством параметров. OpenAI не раскрывает количество параметров для своих моделей.)

Согласно тестированию Alibaba, QwQ-32B-Preview превосходит модели OpenAI o1 на тестах AIME и MATH. AIME использует другие модели ИИ для оценки производительности модели, тогда как MATH представляет собой набор текстовых задач.

QwQ-32B-Preview может решать логические головоломки и отвечать на достаточно сложные математические вопросы благодаря своим возможностям «рассуждения». Но он не идеален. Представитель Alibaba отмечает в сообщении в блоге , что модель может неожиданно переключать языки, «застревать» в циклах и плохо справляться с задачами, требующими «здравого смысла».

В отличие от большинства ИИ, QwQ-32B-Preview и другие модели рассуждений эффективно проверяют факты сами. Это помогает им избегать некоторых ловушек, которые обычно мешают моделям, а недостатком является то, что им часто требуется больше времени, чтобы прийти к решениям. Подобно o1, QwQ-32B-Preview рассуждает о задачах, планируя заранее и выполняя ряд действий, которые помогают модели выдавать ответы.

QwQ-32B-Preview «открыто» доступна по лицензии Apache 2.0. Инструмент можно использовать для коммерческих приложений.

Больше интересного

Актуальное

Безопасность и ИИ становятся основными статьями расходов бизнеса
В Google создают новый диспетчер задач для Chrome на Windows 11 для повышения производительности
В NordLayer представили инструмент обнаружения вредоносных программ для обеспечения безопасности бизнеса
Ещё…