Компания Meta* анонсировала семейство нейросетей Llama 3.1

23 июля 2024 года Meta* представила новое семейство моделей искусственного интеллекта Llama 3.1, которое включает в себя: Llama 3.1 8B, Llama 3.1 70B и Llama 3.1 405B. Новые модели поддерживают увеличенную длину текста до 128 тысяч символов.
Компания Meta* анонсировала семейство нейросетей Llama 3.1

Компания Meta* анонсировала семейство нейросетей Llama 3.1 Фото: сгенерировано нейросетью Яндекс Шедеврум

Llama (Large Language Model Meta* AI) — семейство языковых моделей, разработанных компанией Meta*. Эти модели используются для различных задач, таких как генерация текста, автоматический перевод, резюмирование и др. Первоначально Llama была выпущена как модель, ориентированная на исследовательское и коммерческое использование. Llama 3.1 — это обновлённая версия семейства Llama, представляющая собой значительное улучшение по сравнению с предыдущими версиями. Она включает три модели: Llama 3.1 8B, Llama 3.1 70B и Llama 3.1 405B, где цифры обозначают количество параметров в миллиардах.

Производительность Llama 3.1 была протестирована на более чем 150 различных наборах данных, а также прошла множество оценок с участием людей для сравнения с другими моделями в реальных условиях. Результаты показали, что Llama 3.1 405B может соперничать с ведущими моделями, такими как GPT-4, GPT-4o и Claude 3.5 Sonnet.В Meta* утверждают, что Llama 3.1 405B является самой крупной и мощной доступной открытой моделью. Модели меньшего размера из серии Llama 3.1 также успешно конкурируют с аналогичными по размеру закрытыми и открытыми моделями.

Модели Llama 3.1 можно использовать через такие платформы, как Google Cloud, NVIDIA, Dell, Azure, Databricks, Groq и AWS. Разработчики могут использовать модель Llama 3.1 405B удалённо через серверный API в Azure AI, что упрощает её интеграцию и использование в проектах. Доработанные версии Llama 3.1 8B и Llama 3.1 70B также доступны в каталоге моделей Azure AI.

Из сообщения генерального директора Meta*, Марка Цукерберга к выходу Llama 3.1:

«Сегодня несколько технологических компаний разрабатывают ведущие закрытые модели. Но открытый исходный код быстро сокращает этот разрыв. В прошлом году Llama 2 была сопоставима лишь с моделями предыдущего поколения. В этом году Llama 3 уже конкурирует с самыми передовыми моделями и лидирует в некоторых областях. Начиная со следующего года, мы ожидаем, что будущие модели Llama станут самыми передовыми в отрасли. Но даже сейчас Llama уже лидирует по открытости, модифицируемости и экономической эффективности.»

Выпуск семейства Llama 3.1 знаменует собой важный этап в индустрии искусственного интеллекта с открытым исходным кодом, считают специалисты. По их словам, благодаря улучшенной производительности, увеличенной длине контекста и возможности интеграции с различными облачными платформами, Llama 3.1 устанавливает новые стандарты для открытых моделей ИИ.

*Llama (Large Language Model Meta* AI) является продуктом компании Meta, признанной экстремистской и запрещенной в Российской Федерации.

Упомянутые сервисы

Microsoft Azure Одна из открытых и гибких платформ облачных вычислений корпоративного класса для эффективной работы.
Одна из открытых и гибких платформ облачных вычислений корпоративного класса для эффективной работы.
Amazon Web Services Инфраструктура облачных сервисов для предоставления таких услуг как: хранение данных, аренда серверов и предоставление мощностей.
Инфраструктура облачных сервисов для предоставления таких услуг как: хранение данных, аренда серверов и предоставление мощностей.
Google Cloud Platform Облачная платформа для создания IT-инфраструктуры (базы данных, облачные хранилища, хостинг и другое).
Облачная платформа для создания IT-инфраструктуры (базы данных, облачные хранилища, хостинг и другое).
ChatGPT Нейросеть для общения и генерации идей.
Нейросеть для общения и генерации идей.
Claude AI Искусственный интеллект для обобщения больших объёмов текста и данных.
Искусственный интеллект для обобщения больших объёмов текста и данных.
Посмотреть всё

1 комментарий

Добавить комментарий

Больше интересного

Актуальное

В системе Altevics завершена разработка всех основных ITSM-процессов
Позволяющую атаковать пользователей Telegram через видеофайлы уязвимость обнаружили исследователи
В CrowdStrike рассказали о причинах глобального сбоя Windows
Ещё…