Читая этот пост, вы, возможно, уже знали или пробовали torchserve, triton, seldon core, tf serve и даже kserve. Это хорошие продукты. Однако, если вы не используете очень простую модель или написали много кода, модель является лишь его частью. Не так-то просто интегрировать с ними свои коды.
Здесь у вас есть еще одна альтернатива: Pinferencia.
Github: Pinferencia — посмотрите.
Что такое Пинференсия?
Pinferencia (python
+ inference
) призвана предоставить самый простой способ обслуживания любой из ваших моделей машинного обучения с помощью полностью функционирующего Rest API.
Прямо вперед. Простой. Мощный.
Установить
pip install “pinferencia[uvicorn]”
Попробуй это сейчас!
Создать приложение
app.py
from pinferencia import Server class MyModel: def predict(self, data): return sum(data) model = MyModel() service = Server() service.register( model_name="mymodel", model=model, entrypoint="predict", )
Бегать
uvicorn app:service --reload
Ура, ваш сервис жив. Зайдите на http://127.0.0.1:8000/ и получайте удовольствие.
У вас будет полная страница документации по API, с которой можно поиграться:
Вы можете протестировать свою модель прямо здесь:
API все здесь.
Github: Пинференсия.