До сих пор добавление возможностей искусственного интеллекта в ваше приложение означало, что приложение Python на серверной части выполняло работу, а браузер, использующий JavaScript, мог запрашивать модели машинного обучения для предоставления прогнозов и получения ответов для пользователя, вызывая API конечных точек.

Но сейчас все меняется, с ростом мощности движков JavaScript разработчики интерфейсов могут использовать эти функции ИИ непосредственно из браузера без необходимости использования серверной части.

Содержание

  • HuggingFace.js
  • Face-API.js
  • Exadel CompreFace
  • Отслеживание.js
  • ДжилизВебоджи
  • JeelizОчкиVTOWidget
  • JeelizFaceФильтр
  • Заключение

HuggingFace.js (88 тысяч звезд)



У HuggingFace есть огромная модель машинного обучения с открытым исходным кодом (150 000), которую вы можете бесплатно загрузить и использовать с их веб-сайта.

Некоторые варианты использования HuggingFace:

  • Классификация изображений (2 690 моделей)
  • Обнаружение объектов на изображениях (326 моделей)
  • Ответ на вопрос (4 086 моделей)
  • Обобщение текста(922 модели)
  • Текстовая классификация (14 727 моделей)
  • Перевод языков (1 962 модели)
  • Анализ настроений

Удивительно, но многие лидеры технологической отрасли используют модели, обученные с помощью HuggingFace: Google, Meta, Microsoft, Grammarly…

Вы можете начать использовать HaggingFace, сначала выбрав модель, а затем вызвать ее с помощью Hosted Inference APIs, которые представляют собой простые вызовы API на веб-сайт HaggingFace, и знаете что? Это бесплатно (для разработчиков).

Face-API.js (14,8 тыс. звезд)



Face-API.js — это API JavaScript для обнаружения и распознавания лиц в браузере, реализованный поверх основного API tensorflow.js.

Некоторые варианты использования Face-api:

  • Распознавание лиц ( SSD Mobilenet V1, Tiny Face Detector, MTCNN)
  • Распознавание лиц (FaceNet, MobileNetV1)
  • Обнаружение лицевых ориентиров (FaceLandmark68Net, FaceLandmark68TinyNet, FaceLandmark68TinyNet)

Между "()" указаны имена обученных моделей.

Exadel CompreFace (2,8 тыс. звезд)

Exadel CompreFace — это бесплатное приложение с открытым исходным кодом, которое можно запускать в образе для создания докеров, локально или в облаке.

Он может работать на процессоре или графическом процессоре и имеет встроенную систему управления ролями для контроля доступа к сервису.

Вы можете интегрировать его с любой системой без предварительных навыков машинного обучения, используя вызовы Rest API.

У вас есть API для:

  • Распознавание лица
  • Проверка лица
  • Распознавание лиц
  • Обнаружение ориентира
  • Обнаружение маски
  • Обнаружение положения головы
  • Признание возраста и пола

Чтобы запустить внешнее приложение JavaScript, просто перейдите к этому пошаговому руководству на GitHub:



Tracking.js (9,3 тыс. звезд)



Библиотека tracking.js привносит в браузер алгоритмы и функции компьютерного зрения, используя современные спецификации HTML5. Все это с использованием очень небольшого веса (~ 7 КБ).

Эти алгоритмы можно использовать для таких функций, как:

  • Распознавание лиц
  • Распознавание лица
  • отслеживание цвета

Tracking.js использует «алгоритм Виолы-Джонса» под капотом, и знаете что? Это тот же алгоритм, который OpenCV использует для отслеживания различных типов объектов, просто изменяя обучающие данные, которые используются в качестве входных данных.

jeelizWeboji (1k звезд)



С jeelizWeboji вы можете создать свой собственный анимированный смайлик, встроенный непосредственно в ваше веб-приложение, используя ваш графический процессор.

Если у вас мощный графический процессор, будет обработано много эмоций/секунд, и результат будет плавным и точным.

Для лучшего обнаружения эмоций:

  • Лицо должно быть хорошо освещено: должны быть различимы нос, глаза,
  • Избегайте контрового света: фоном должна быть стена, а не окно.
  • Лицо не должно быть слишком далеко или слишком близко к камере: в идеале лицо должно покрывать 1/3 высоты камеры. Он должен быть полностью виден,
  • Камера должна быть размещена перед пользователем. Вид сбоку не рекомендуется,
  • Борода и усы могут затруднить обнаружение движений рта, а очки могут мешать обнаружению глазами.

А это несколько живых примеров из репозитория jeelizWeboji на GitHub:





jeelizGlassesVTOWidget (221 звезда)



Используя jeelizGlassesVTOWidget и несколько строк кода, вы можете революционизировать процесс покупки очков на своем веб-сайте электронной коммерции или в мобильном приложении.

Просто сидя дома, перед камерой (мобильного или ноутбука), потребитель может примерить (виртуально) вашу коллекцию очков, и если он/она удовлетворен, он/она может продолжить процесс покупки .

Живой сайт:



jeelizFaceFilter(2.4k звезд)



Библиотека jeelizFaceFilter обнаруживает и отслеживает лица в режиме реального времени по видео с камеры. Затем можно накладывать 3D-контент для приложений дополненной реальности.

Эта библиотека легкая и не включает в себя какой-либо 3D-движок или стороннюю библиотеку.

Вот основные возможности библиотеки jeelizFaceFilter:

  • распознавание лица,
  • отслеживание лица,
  • определение поворота лица,
  • обнаружение открывания рта,
  • обнаружение и отслеживание нескольких лиц
  • очень прочный для всех условий освещения
  • захват видео с возможностью HD-видео
  • мобильный дружественный
  • взаимодействует с 3D-движками, такими как THREE.JS, BABYLON.JS, A-FRAME,
  • интерфейс с более доступными API, такими как CANVAS, CSS3D.

И это несколько живых примеров из репозитория jeelizFaceFilter GitHub.





Заключение

Поскольку мы наблюдаем появление различных библиотек и широкое распространение конкретных версий JavaScript, я с нетерпением жду будущего веб-приложений.

С помощью всего нескольких строк кода вы можете создавать сложные приложения для распознавания лиц и дополненной реальности, ограниченные только вашим воображением.

Возможности безграничны, и мне не терпится увидеть, что нас ждет в будущем.

Спасибо, что прочитали мою статью, я ценю ваше время.

Дополнительные материалы на PlainEnglish.io.

Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Подпишитесь на нас в Twitter, LinkedIn, YouTube и Discord .

Заинтересованы в масштабировании запуска вашего программного обеспечения? Ознакомьтесь с разделом Схема.