За последние годы модели больших языков (LLM) прошли долгий путь. От быстрого создания диалогов до обобщения текста и создания статей — языковые модели чрезвычайно упростили для любого человека создание продукта на основе НЛП. В результате каждый день появляются сотни приложений, в основном использующих такие API, как OpenAI, Cohere или Stable Diffusion.

Глядя на эти разработки, можно задаться вопросом: каков разрушительный потенциал таких приложений? Готовы ли они обеспечить преобразующие результаты во всех отраслях? Или их влияние будет ограничено определенными узкими вариантами использования?

Кроме того, о каких проблемах должны знать разработчики и владельцы бизнеса, чтобы оказывать долгосрочное влияние в этой области?

Рост разработки продуктов, ориентированной на LLM

Большие языковые модели (LLM) значительно продвинулись за последний год, в первую очередь благодаря развитию методов, которые лучше приводят их в соответствие с человеческими предпочтениями. Это привело к впечатляющей способности генерировать беглый текст в широком диапазоне стилей и для различных целей со значительно большей точностью, детализацией и связностью, чем это было возможно ранее.

Способность LLM следовать инструкциям и учиться на примерах, представленных в их контексте, позволила решать практически любую задачу НЛП с помощью LLM,то есть,по крайней мере, в принципе. Все, что нужно, — это тщательно сконструированная подсказка, способная извлечь требуемую функциональность из LLM. К самому LLM можно легко получить доступ через простой вызов API.

Прогресс в области LLM, а также их общедоступность привели к взрывному росту приложений на основе LLM, ориентированных на различные варианты использования. От создания сообщений в блогах до создания ответов по электронной почте, обобщения статей и встреч, беглых диалогов или генерации кода.

Большинство этих приложений ориентированы на узкий рабочий процесс пользователя, по существу абстрагируя определенные функции лежащего в основе LLM. Обычно они работают, взимая надбавку к плате за API.

Проблемы с разработкой продуктов искусственного интеллекта, ориентированных на API

Когда дело доходит до решения реальных проблем, за которые пользователи готовы платить, быстро выявляются некоторые недостатки подхода API LLM. Давайте рассмотрим некоторые из них.

Задача 1: без специализации

LLM — это модели общего назначения, обученные по всему Интернету. Для задач общего назначения, которые требуют только творческих предложений, это обычно нормально: например, предложение заголовка для сообщения в блоге.

Однако многие реальные проблемы требуют значительного или полного уровня автоматизации. Часто проблема лежит в узкой области, такой как извлечение информации из биомедицинских или юридических статей. Таким образом, отсутствие специализации LLM вряд ли полностью соответствует ожиданиям пользователей в этих узких областях, где выходные данные LLM потребуют дополнительной ручной проверки, чтобы убедиться, что они соответствуют ожиданиям по качеству.

Эту проблему можно в определенной степени решить: например, оперативное проектирование, контекстное обучение и точная настройка модели могут помочь лучше привести базовый LLM в соответствие с ожиданиями пользователей. Тем не менее, это, безусловно, не быстрая и непростая задача, поскольку она требует глубоких знаний предметной области, тщательно составленных наборов данных отзывов людей, а также глубокого понимания лежащих в основе технологий. Это проблемы, которые вряд ли будут решены простым вызовом API, но потребуют более фундаментального подхода к проблеме.

Приложения на основе API, которые не могут обеспечить ожидаемый уровень автоматизации, рискуют стать просто еще одним инструментом, с которым интересно поиграть, но который не интегрируется в существующие рабочие процессы, а значит, приносит прибыль или оказывает долгосрочное влияние.

Задача 2: никакой дифференциации

API-интерфейсы LLM значительно ускорили процесс создания прототипов ИИ. Прототип, на разработку которого могли уйти годы, теперь можно построить за неделю. Все, что нужно, — это красивый интерфейс, который инкапсулирует желаемый рабочий процесс пользователя: API делает остальную тяжелую работу.

Скорость и гибкость, которые обеспечивают API, безусловно, поразительны: мы видим так много творческих приложений LLM. Однако на более фундаментальном уровне становится неясным, какие решения действительно имеют что-то, что значительно отличает их от базового LLM, доступного для всех. Другими словами, есть ли что-то более фундаментальное под капотом, или клиенты, по сути, платят за доступ к отточенной подсказке за красивым интерфейсом?

Хотя наверняка будут области, где этот подход сработает и даже приведет к привлечению пользователей, вопрос в том, что произойдет, когда на следующей неделе выйдут 5 похожих приложений? Реально ли построить устойчивый бизнес, опираясь исключительно на такие API?

В конечном счете, победителями, добившимися успеха в гонке LLM-приложений, скорее всего, станут те, кому удастся быстро привлечь пользователей, понять, в чем заключается фундаментальная ценность, и извлечь выгоду из этой привлекательности для создания индивидуальных решений, которые отличают их от конкурентов. .

Проблема 3: Отсутствие собственности

Зависимость от LLM API также создает ряд бизнес-рисков. Поставщик API может в любой момент решить внести изменения, которые могут существенно повлиять на бизнес. Например, они могут решить изменить цену API, изменить структуру оплаты, условия и положения или даже внести изменения в базовую модель.

У многих пользователей также могут быть проблемы с регулированием и безопасностью данных, поскольку их данные передаются третьим лицам.

Потенциально это может стать рецептом катастрофы. Что произойдет с вашим приложением, если API перестанет работать должным образом или произойдет сбой? Поскольку вы не владеете технологией, у вас нет резервного варианта. Вы можете переключиться на другого поставщика API, но будет ли все работать точно так же, как раньше? Кроме того, как вы можете установить доверие своих пользователей в том, что данные обрабатываются должным образом и будут обрабатываться должным образом в будущем?

Отсутствие контроля и прозрачности с API, безусловно, является аспектом, который следует серьезно учитывать, особенно если весь ваш бизнес-кейс построен вокруг них.

Заключение и перспективы

Мы являемся свидетелями технологической революции, обусловленной доступностью мощных инструментов искусственного интеллекта. Мы все еще находимся на вершине айсберга с точки зрения возможных приложений, и есть много неизвестных относительно того, как будут выглядеть следующие 6–12 месяцев. Одно можно сказать наверняка: LLM никуда не денутся, и в ближайшие годы они окажут значительное влияние на наше общество.

API-интерфейсы LLM, безусловно, играют свою роль: они предоставляют интерфейс для мощных LLM, которые упрощают создание продуктов ИИ или добавление некоторых функций ИИ в существующий продукт, и все это без необходимости вкладывать средства в какую-либо инфраструктуру или разработку. В краткосрочной перспективе многие из этих продуктов, вероятно, наберут обороты. Однако проблемы, изложенные в этой статье, затрудняют выход за пределы стадии прототипа в долгосрочной перспективе по мере роста ожиданий пользователей и усиления конкуренции.

Компании-победители в этой области, скорее всего, будут теми, кто: (1) извлекает выгоду из API для быстрой итерации прототипов, сбора данных и отзывов, определяя при этом истинную ценность в нише; (2) Создавайте запатентованные технологии как можно быстрее: курируйте пользовательские наборы данных, разрабатывайте и обучайте пользовательские технологии, которые преобразуют прототип в надежное решение, решающее реальную проблему.

Спасибо за прочтение! Если вам понравилась эта статья, рассмотрите возможность подписаться на мой информационный бюллетень НЛП или канал YouTube.
Если вы ищете передовой опыт в области обработки естественного языка, вам следует ознакомиться с нашими услугами в The Global NLP Lab.