Обновление ChatGPT позволяет его искусственному интеллекту «видеть, слышать и говорить»

Команда OpenAI объявила о значительном обновлении ChatGPT, которое позволяет моделям искусственного интеллекта GPT-3.5 и GPT-4 анализировать изображения и реагировать на них в рамках текстового разговора.
Обновление ChatGPT позволяет его искусственному интеллекту «видеть, слышать и говорить»

Обновление ChatGPT позволяет его искусственному интеллекту «видеть, слышать и говорить». Фото: из архива компании

Кроме того, по словам представителей OpenAI, в мобильное приложение ChatGPT будут добавлены параметры синтеза речи, которые в сочетании с существующими функциями распознавания речи позволят вести полностью устные разговоры с помощником искусственного интеллекта.

OpenAI планирует внедрить эти функции в ChatGPT для подписчиков Plus и Enterprise «в течение следующих двух недель». Отмечается, что синтез речи появится только на iOS и Android, а распознавание изображений будет доступно как в веб-интерфейсе, так и в мобильных приложениях.

В OpenAI сообщают, что новая функция распознавания изображений в ChatGPT позволяет пользователям загружать одно или несколько изображений для разговора, используя модели GPT-3.5 или GPT-4. Эту функцию можно использовать для различных повседневных задач: от выяснения того, что на ужин, путем фотографирования холодильника и кладовой, до устранения неполадок, почему гриль не запускается.

Пользователи могут использовать сенсорный экран своего устройства, чтобы обвести части изображения, на которых они хотели бы сосредоточить внимание ChatGPT.

На сайте OpenAI размещен рекламный видеоролик, иллюстрирующий гипотетический обмен информацией с ChatGPT. В нем пользователь спрашивает, как поднять сиденье велосипеда, предоставляя фотографии, а также инструкцию по эксплуатации и изображение пользовательского ящика с инструментами. ChatGPT реагирует и советует пользователю, как завершить процесс.

Новая функция синтеза голоса ChatGPT позволяет вести двусторонний разговор с ChatGPT. В компании заявляют, что после запуска этой функции пользователи смогут выбрать один из нескольких голосов, которые «были созданы в сотрудничестве с профессиональными актерами озвучивания».

Startpack подготовил список систем искусственного интеллекта. Искусственный интеллект (ИИ) широко используется в бизнесе — начиная от повышения качества обслуживания клиентов до автоматизации бизнес-процессов. Один из видов искусственного интеллекта — нейронные сети. Нейросети с помощью алгоритмов способны распознавать закономерности в данных и генерировать новые. Это лишь часть сфер, где может применяться искусственный интеллект. Внедрение искусственного интеллекта в работу компании сократит расходы и время.

Статьи по теме

Упомянутый сервис

ChatGPT Нейросеть для общения и генерации идей.
Нейросеть для общения и генерации идей.

Больше интересного

Актуальное

Microsoft публикует код «ранней стадии» разработки драйверов Windows на Rust
GitHub призывает пользователей Copilot изменить настройку брэндмауэров
В Gmail для Android появилась функция «Выбрать все»
Ещё…