Пока мы обсуждали предстоящее прибытие GPT-4, Илон был готов бросить еще один мяч. ChatGPT — еще один продукт исследовательской компании OpenAI и родственник модели InstructGPT, которая превзошла модель GPT-3.
Как следует из названия, ChatGPT имеет формат окна чата и соответствующим образом взаимодействует со своими пользователями. OpenAI утверждает, что ChatGPT может делать следующее:
Дополнительные вопросы
Признавайте ошибки
Опровергайте неправильные предпосылки
Отклоняйте неуместные запросы.
Инструмент искусственного интеллекта был запущен 30 ноября 2022 года, и в течение недели после запуска компания испытала массовый всплеск пользователей, который превысил 1 миллион пользователей. Более того, он продемонстрировал впечатляющий отклик в ответах на сложные математические вопросы, а также в исправлении и отладке кода с пояснениями. ChatGPT предоставляет подробные ответы и может создавать структурированные сценарии и статьи.
Модель ChatGPT обучается с использованием Reinforcement Learning from Human Feedback (RLHF). Он использует те же методы, что и InstructGPT, но имеет небольшое отличие в процессе сбора данных.
Инструмент ИИ был обучен под наблюдением модификаций. Задача инструкторов по ИИ состояла в том, чтобы играть роли как пользователя, так и помощника искусственного интеллекта; им были даны сгенерированные моделью предложения, чтобы помочь им соответствующим образом составить свои ответы.
Модели ChatGPT и GPT-3.5 обучаются в супервычислительной инфраструктуре Azure AI. ChatGPT — это модифицированная модель серии GPT-3.5.
Совершенство приходит со временем, так как обеспечение безошибочных результатов ИИ — непростая задача. Для достижения качественных результатов требуются годы на обучение алгоритмов и улучшение процесса машинного обучения путем ввода огромных объемов данных. Согласно OpenAI, они стремятся улучшить инструмент ИИ, чтобы получать высококачественные результаты и устранять системные недостатки на основе отзывов пользователей.