OpenAI представила мультимодальный GPT-4 с «производительностью человеческого уровня»

Команда OpenAI объявила о выпуске GPT-4, преемника своих популярных моделей GPT-3 и 3.5, и пообещала «производительность человеческого уровня» в более творческой и стабильной упаковке.

OpenAI представила мультимодальный GPT-4 с «производительностью человеческого уровня». Фото: СС0

Новая мультимодальная модель искусственного интеллекта может принимать как текст, так и изображения в качестве входных данных, и была заявлена как более креативная, надежная и детальная, чем ее предшественница. Было показано, что инструмент обрабатывает документы, фотографии и диаграммы на том же уровне, что и ввод текста, и выделяет сложный контекст и тон из пользовательских вводов.

В OpenAI показали, что GPT-4 может надежно идентифицировать и подписывать объекты на изображениях, а также использовать их в качестве входного контекста в ряде примеров. К ним относятся обработка информации из диаграммы, перевод и решение экзаменационного вопроса по французскому языку, а также определение того, что неправильно или смешно в конкретном изображении.

В ходе демонстрации GPT-4 в прямом эфире президент и соучредитель OpenAI Грег Брокман использовал модель для перевода фотографии эскиза веб-сайта, который он сделал, в рабочий HTML-код.

GPT-4 также предлагает значительное повышение точности и стабильности по сравнению с результатами GPT-3 и GPT-3.5, получив баллы на 10% выше лучших испытуемых на смоделированном экзамене на адвоката, в то время как GPT-3.5 набрал на 10% ниже. В своем сообщении в блоге OpenAI заявила, что модель показала «производительность на уровне человека в различных профессиональных и академических тестах».

Новая модель может обрабатывать длинные документы, превышающие 25 тыс слов, и позволяет анализировать подробные формы и агрегировать целые веб-страницы.

В контролируемых тестах он также смог ответить на обширные вопросы с несколькими вариантами ответов на 26 языках с уровнем понимания и точности выше, чем у английского языка GPT-3.5.

Применение нового GPT-4 может значительно улучшить автоматизацию работы с документами и взаимодействие с клиентами, а также агрегацию и перевод сообщений на иностранных языках компаниями.

Мультимодальные возможности GPT-4, где входными данными могут быть как текст, так и изображения, предполагает ряд новых вариантов использования. Это может быть визуализация информации или при идентификации и описании контента.

Startpack подготовил список систем искусственного интеллекта. Искусственный интеллект (ИИ) широко используется в бизнесе — начиная от повышения качества обслуживания клиентов до автоматизации бизнес-процессов. Один из видов искусственного интеллекта — нейронные сети. Нейросети с помощью алгоритмов способны распознавать закономерности в данных и генерировать новые. Это лишь часть сфер, где может применяться искусственный интеллект. Внедрение искусственного интеллекта в работу компании сократит расходы и время.

Статьи по теме