Пока мы обсуждали предстоящее прибытие GPT-4, Илон был готов бросить еще один мяч. ChatGPT — еще один продукт исследовательской компании OpenAI и родственник модели InstructGPT, которая превзошла модель GPT-3.

Как следует из названия, ChatGPT имеет формат окна чата и соответствующим образом взаимодействует со своими пользователями. OpenAI утверждает, что ChatGPT может делать следующее:

Дополнительные вопросы
Признавайте ошибки
Опровергайте неправильные предпосылки
Отклоняйте неуместные запросы.

Инструмент искусственного интеллекта был запущен 30 ноября 2022 года, и в течение недели после запуска компания испытала массовый всплеск пользователей, который превысил 1 миллион пользователей. Более того, он продемонстрировал впечатляющий отклик в ответах на сложные математические вопросы, а также в исправлении и отладке кода с пояснениями. ChatGPT предоставляет подробные ответы и может создавать структурированные сценарии и статьи.

Модель ChatGPT обучается с использованием Reinforcement Learning from Human Feedback (RLHF). Он использует те же методы, что и InstructGPT, но имеет небольшое отличие в процессе сбора данных.

Инструмент ИИ был обучен под наблюдением модификаций. Задача инструкторов по ИИ состояла в том, чтобы играть роли как пользователя, так и помощника искусственного интеллекта; им были даны сгенерированные моделью предложения, чтобы помочь им соответствующим образом составить свои ответы.

Модели ChatGPT и GPT-3.5 обучаются в супервычислительной инфраструктуре Azure AI. ChatGPT — это модифицированная модель серии GPT-3.5.

Совершенство приходит со временем, так как обеспечение безошибочных результатов ИИ — непростая задача. Для достижения качественных результатов требуются годы на обучение алгоритмов и улучшение процесса машинного обучения путем ввода огромных объемов данных. Согласно OpenAI, они стремятся улучшить инструмент ИИ, чтобы получать высококачественные результаты и устранять системные недостатки на основе отзывов пользователей.