Руководство по внедрению чат-бота из каталога NVIDIA Riva

Пошаговые инструкции по установке и запуску ноутбуков Jupyter

Введение

Riva приносит глубокое обучение в массы. Мультимодальный аспект Riva лучше всего понимается в контексте того, что NVIDIA хочет предложить Riva с точки зрения функциональности.

В облаке NVIDIA GPU, также известном как NGC, есть каталог различных сценариев реализации. Каждый из этих элементов каталога содержит пошаговые инструкции и сценарии по созданию моделей глубокого обучения с примерами показателей производительности и точности для сравнения результатов.

Эти записные книжки содержат рекомендации по созданию моделей языкового перевода, преобразования текста в речь, классификации текста и многого другого.

Выше представлены элементы каталога NVIDA Riva Transfer Learning Toolkit (TLT), которые находятся в вашем распоряжении. Каждый элемент каталога содержит пошаговые инструкции по установке и запуску Jupyter Notebooks.

Что интересно в этом наборе функций, так это то, что Riva готова стать настоящим диалоговым агентом. Мы общаемся как люди не только голосом, но и определяя взгляд говорящего, движение губ и т. д.

Еще одним ключевым направлением деятельности Riva является трансферное обучение. Существует значительная экономия средств, когда речь идет о усовершенствованных базовых моделях Riva и их перепрофилировании для конкретных целей.

Функциональность, которая в настоящее время доступна в Riva, включает ASR, STT и NLU. Пограничная установка является огромным преимуществом.

Настройка вашей среды

Доступ к программному обеспечению NVIDA, Jupyter Notebooks и демо-приложениям прост, а ресурсов достаточно. Единственным препятствием является доступ к графическому процессору NVIDIA на базе архитектуры Turing или Volta.

В этой статье я рассматриваю один из наиболее экономичных способов доступа к такой инфраструктуре через инстанс AWS EC2.

Ноутбуки NVIDIA Riva

Для начала у NVIDIA Riva есть довольно много доступных примеров Jupyter Notebook, которые вы можете использовать для пошагового изучения. Они включают в себя различные реализации речи, в том числе преобразование речи в текст, преобразование текста в речь, именованные объекты, обнаружение намерений и слотов и многое другое.

При нажатии на каждый элемент каталога вы увидите список команд, которые необходимо выполнить для запуска записной книжки. Эти команды достаточно точны, и их выполнение не представляет проблемы.

При использовании команд NGC в командной строке запрашивается ключ API, который необходимо получить на странице настройки NVIDIDA NGC.

В этой статье я подробно объясняю процесс установки, SSH и туннелирования. Туннель SSH через порт 8888 необходим для запуска Jupyter Notebook в браузере на вашем локальном компьютере.

Блокнот проведет вас через процесс определения каталогов, моделей обучения и экспорта в файл .riva. И последующий рабочий процесс развертывания для использования файла .riva и развертывания его в Riva.

Заключение

Моя первая мысль заключалась в том, что пройти этап самостоятельной установки и запустить демонстрационные версии было бы очень сложно… учитывая, что это NVIDA и среда глубокого обучения.

Наоборот, разобраться с Riva на уровне демо-приложения было просто, если следовать документации. После запуска этого базового демонстрационного голосового бота, каковы следующие шаги?

Голосовой бот, в котором осуществляется интеграция Rasa с Riva, — это шаг вверх по сложности и логический следующий шаг. Также просмотр Jupyter Notebooks дает хорошие примеры того, как взаимодействовать с API.

Положительные стороны и соображения

Положительные ошеломляющие…

  • Реализации могут быть облачными или локальными/пограничными.
  • Рива говорит о критически важных, промышленных когнитивных услугах и разговорном искусственном интеллекте.
  • Новая структура для высокопроизводительного ASR, STT и NLU.
  • Разработчики имеют доступ к передаче обучения и использованию инвестиций, сделанных NVIDIA.
  • Среда графического процессора NVIDIA соответствует критически важным требованиям, в которых задержки можно свести на нет.
  • Четкая дорожная карта для Riva с точки зрения ближайшего будущего и предстоящих функций.
  • Riva удовлетворяет требования к повсеместным внешним интерфейсам.

Соображения

  • Доступ, разработка и развертывание кажутся устрашающими, а структура кажется сложной. В этой статье я хочу развенчать опасения доступа. Однако производственное развертывание наверняка будет сложным.
  • Скорее всего, для производственной среды первостепенное значение будут иметь конкретные аппаратные соображения; особенно там, где недопустима задержка в облаке/подключении.

Услуги, доступные сейчас через Riva:

  • Распознавание речи обучено тысячам часов речевых данных в потоковом или пакетном режиме.
  • Синтез речи доступен в пакетном и потоковом режиме.
  • NLU API с множеством сервисов.

Появление Riva, несомненно, станет толчком для текущего рынка, особенно со встроенными решениями для разговорного ИИ. Свобода установки и открытая архитектура сослужат NVIDIA хорошую службу. Как уже отмечалось, производственная архитектура и развертывание потребуют тщательного рассмотрения.



«Подпишитесь на мою рассылку.
НЛП/НЛУ, Чат-боты, Голос, Разговорный UI/UX, CX Designer, Разработчик, Вездесущие пользовательские интерфейсы, Ambient…кобусгрейлинг. мне"