Руководство по тестированию, оценке и мониторингу вызовов LLM для производства с использованием LangSmith.
Что такое ЛэнгСмит?
LangSmith — это унифицированная платформа, которая позволяет разработчикам создавать LLM-приложения производственного уровня, а также отлаживать, тестировать, оценивать и отслеживать эти приложения, обеспечивая эффективные жизненные циклы разработки, обслуживания и улучшения моделей ИИ. LangSmith создан разработчиками, которые предоставили вам LangChain, и легко интегрируется с этой библиотекой; проект в настоящее время находится в стадии бета-тестирования и периодически разрешает доступ к новым подпискам.
Предпосылки
В этой статье основное внимание уделяется LangSmith и его возможностям, поэтому я предоставил приложение LangChain в качестве примера, который вы можете использовать для изучения.
Руководство
LangSmith предоставляет несколько функций, которые можно использовать при улучшении наших приложений с поддержкой LLM. Первый заключается в отслеживании запусков, связанных с активным экземпляром, а затем в тестировании и оценке любых сгенерированных подсказок или ответов. Мы рассмотрим два варианта использования по мере прохождения этого руководства.
Сценарий № 1. Отслеживание
Сначала зарегистрируйтесь в LangSmith и создайте ключ API, перейдя на страницу настроек с помощью значка ключа в левом нижнем углу этой страницы.
Затем git клонируйте репозиторий:
git clone [email protected]:Ricoledan/langsmith-demo.git
Установите необходимые зависимости:
pip install -r requirements.txt
Скопируйте .env.example в файл .env:
cp .env.example .env
Обновите файл .env, указав свои учетные данные, чтобы настроить среду.
# .env LANGCHAIN_TRACING_V2=true LANGCHAIN_ENDPOINT=https://api.smith.langchain.com LANGCHAIN_API_KEY=<your-api-key> LANGCHAIN_PROJECT=langsmith-demo # if not specified, defaults to "default"…