Краткое руководство по использованию LLM с открытым исходным кодом

Это третья статья из серии Использование больших языковых моделей (LLM) на практике. Здесь я дам руководство для начинающих по библиотеке Hugging Face Transformers, которая предоставляет простой и бесплатный способ работы с широким спектром языковых моделей с открытым исходным кодом. Я начну с обзора ключевых понятий, а затем углублюсь в пример кода Python.

В предыдущей статье этой серии мы исследовали OpenAI Python API и использовали его для создания пользовательского чат-бота. Однако одним недостатком этого API является то, что вызовы API стоят денег, что может плохо масштабироваться для некоторых вариантов использования.

В этих сценариях может быть выгодно обратиться к решениям с открытым исходным кодом. Один из популярных способов сделать это — использовать библиотеку Transformers Hugging Face.

Что такое обнимать лицо?

Hugging Face – это компания, занимающаяся искусственным интеллектом, которая стала крупным центром машинного обучения (ML) с открытым исходным кодом. Их платформа имеет 3 основных элемента, которые позволяют пользователям получать доступ к ресурсам машинного обучения и делиться ими.

Во-первых, это их быстрорастущий репозиторий предварительно обученных моделей машинного обучения с открытым исходным кодом для таких вещей, как обработка естественного языка (NLP), компьютерное зрение и многое другое. Во-вторых, это их библиотека наборов данных для обучения моделей машинного обучения практически для любой задачи. В-третьих, и наконец, это Spaces, представляющая собой набор приложений машинного обучения с открытым исходным кодом, размещенных Hugging Face.

Сила этих ресурсов заключается в том, что они создаются сообществом, что позволяет использовать все преимущества открытого исходного кода (т. е. бесплатность, широкий выбор инструментов, высококачественные ресурсы и быстрый темп инноваций). Хотя это делает создание мощных проектов ML более доступным, чем раньше, есть еще один ключевой элемент экосистемы Hugging Face — библиотека Transformers.

🤗Трансформеры

Transformers — это библиотека Python, упрощающая загрузку и обучение современных моделей машинного обучения. Хотя изначально он был создан для разработки языковых моделей, его функциональные возможности расширились за счет включения моделей для компьютерного зрения, обработки звука и т. д.

Две сильные стороны этой библиотеки: во-первых, она легко интегрируется с Hugging Face’s (упоминалось ранее)…