Познакомьтесь с EleutherAI GPT-Neo, большой языковой моделью.
С момента своего выпуска GPT-3 широко известен как инструмент, изменивший правила игры, когда дело доходит до создания текста. OpenAI создает по-настоящему мощную модель машинного обучения с одной лишь оговоркой. Код по-прежнему не является общедоступным, и единственный способ взаимодействия с API - через API. Это может скоро измениться.
Что такое EleutherAI и GPT-Neo?
EleutherAI - это бесплатная группа исследователей, работающих над моделями ИИ с открытым исходным кодом. Их флагманский проект, основанный в июле 2020 года, - GPT-Neo, репликация GPT-3, созданной в OpenAI с огромной языковой моделью с параметрами 175B.
Спустя более полугода они выпустили GPT-Neo два дня назад здесь:
Вот их обновление от 21.03.2021:
1.3B: https://the-eye.eu/public/AI/gptneo-release/GPT3_XL/
2.7B: https://the-eye.eu/public/AI/gptneo-release/GPT3_2-7B/
Для получения дополнительной информации о том, как их настроить, см. Записную книжку colab или прочтите остальную часть файла readme.
Этот репозиторий будет (в основном) заархивирован по мере того, как мы перейдем к репо для обучения графическому процессору, GPT-Neox ».
Если вам интересно, что такое The Pile, это 825 ГиБ разнообразного набора данных моделирования на языке с открытым исходным кодом, состоящего из данных из 22 высококачественных источников, созданного для тестирования больших языковых моделей. Смотрите здесь.
Что дальше с GPT-3?
Еще слишком рано прогнозировать влияние GPT-Neo и его точное сравнение с GPT-3, но стоит рискнуть и попробовать.
Следите за новостями!