Искусственный интеллект (ИИ) и машинное обучение (МО) будут играть ключевую роль в огромной трансформации автомобильной промышленности, интегрируя их в разработку автономных автомобилей. Вместе с другими областями, такими как управление цепочками поставок, производственные операции, мобильные услуги, аналитика изображений и видео, аудиоаналитика играет важную роль в обеспечении успеха беспилотных автомобилей. Благодаря передовым технологическим разработкам и инновациям автомобильная промышленность меняет форму и внедряет новые технологии. Аудиоаналитика резко изменила акцент автомобильных компаний на своем продукте, чтобы повысить удовлетворенность клиентов. К 2030 году объем мирового рынка автономных автомобилей вырастет до 60 миллиардов долларов США.

Аудиоаналитика в рамках машинного обучения в беспилотных автомобилях состоит из аудиоклассификации, НЛП, распознавания голоса/речи и звука. Распознавание голоса и речи стало неотъемлемой частью автономных автомобилей и автомобильной промышленности. В предыдущих моделях автомобилей распознавание голоса и речи было проблемой из-за отсутствия эффективных алгоритмов, надежного подключения и вычислительной мощности на периферии. Кроме того, шум в салоне автомобиля снижал производительность аудиоаналитики, что приводило к ложному распознаванию.

Аудиоаналитика в машинах долгое время была предметом постоянных исследований. Благодаря технологическому прогрессу новые продукты, представленные на рынке, такие как Alexa от Amazon и Siri от Apple, используют ключевые преимущества облачных технологий, которых ранее не хватало другим системам распознавания. Однако для бесперебойной работы этих систем в автономных автомобилях потребуется бесперебойный беспроводной доступ в Интернет.

В последнее время в аудиоаналитике широко используются различные алгоритмы машинного обучения, такие как kNN (K ближайший сосед), SVM (машина опорных векторов), EBT (ансамблированные деревья в пакетах), глубокие нейронные сети (DNN) и обработка естественного языка (NLP).

Различные звуковые характеристики извлекаются из необработанного звука и передаются в качестве входных данных алгоритмам машинного обучения или глубокого обучения.

Для аудиоаналитики, как показано на диаграмме ниже, аудиоданные предварительно обрабатываются для удаления шума, а затем аудиофункция извлекается из аудиоданных. Здесь используются звуковые функции, такие как MFCC (кепстральный коэффициент Mel-частоты), а также статистические функции, такие как эксцесс, дисперсия. Полосы частот MFCC равномерно разнесены по шкале Mel, что очень близко к отклику слуховой системы человека. По той же причине модель обучается с использованием этой функции. Наконец, обученная модель используется для вывода, аудиопоток в реальном времени берется с нескольких микрофонов, установленных в автомобиле, который затем предварительно обрабатывается, и функции будут извлечены. Извлеченная функция будет передана обученной модели для правильного распознавания звука, что будет полезно для принятия правильного решения в автономных автомобилях.

С новыми технологиями доверие конечного пользователя является ключевым моментом, и NLP меняет правила игры, чтобы построить это доверие к автономным автомобилям. NLP позволяет пассажирам управлять автомобилем с помощью голосовых команд, таких как запрос остановки в ресторане, изменение маршрута, остановка в ближайшем торговом центре, включение/выключение света, открытие и закрытие дверей и многое другое. Это делает пассажирский опыт насыщенным и интерактивным.

Давайте рассмотрим несколько вариантов использования, разработанных для автономных автомобилей с использованием аудиоаналитики.

  • Обнаружение аварийной сирены

Звук сирены любого автомобиля скорой помощи, такого как машина скорой помощи, пожарная или полицейская машина, можно обнаружить с помощью различных моделей глубокого обучения, а также моделей машинного обучения, таких как SVM (автомат опорных векторов). Модель обучения с учителем — SVM используется для классификации и регрессионного анализа. Классификационная модель SVM обучается на большом количестве данных звуков аварийной сирены и неаварийных звуков. В этой модели разработана система, которая идентифицирует звук сирены, чтобы принимать соответствующие решения для автономного автомобиля, чтобы избежать любой опасной ситуации. С помощью этой системы обнаружения автономный автомобиль может принять решение остановиться и уступить дорогу машине скорой помощи.

  • Обнаружение аномалий звука двигателя

Автоматическое раннее обнаружение возможного отказа двигателя может стать важной функцией автономного автомобиля. Двигатель автомобиля издает определенный звук, когда он работает в нормальных условиях, и издает другой звук, когда есть какие-то проблемы/неисправности. Многие алгоритмы машинного обучения, доступные среди кластеров K-средних, могут использоваться для обнаружения аномалий в звуке двигателя. В кластеризации k-средних каждая точка данных звука назначается k группе кластеров. Назначение точки данных основано на среднем значении, близком к центроиду этого кластера. В случае аномального звука двигателя точка данных выйдет за пределы нормального кластера и станет частью аномального кластера. С этой моделью можно постоянно следить за состоянием двигателя, и если есть какие-либо аномальные звуковые события, то автономный автомобиль может предупредить пользователя и помочь принять правильные решения, чтобы избежать любой опасной ситуации. Это позволяет избежать полного выхода из строя/поломки двигателя.

  • Смена полосы движения по сигналу

Чтобы автономный автомобиль работал точно так же, как управляемый человеком, он должен эффективно работать в сценарии, где обязательно менять полосу движения, когда транспортному средству сзади нужно срочно обойти, обозначенное сигналом. Случайный лес, алгоритм машинного обучения лучше всего подходит для этого типа задачи классификации. Это контролируемый алгоритм классификации. Как следует из названия, он создаст лес деревьев решений и, наконец, объединит все деревья решений, чтобы получить точную классификацию. Используя эту модель, можно разработать систему, которая будет идентифицировать определенный образец рупора и принимать соответствующее решение.

  • Взаимодействие в автомобиле для автономных автомобилей

НЛП (обработка естественного языка) обрабатывает человеческий язык, чтобы извлечь смысл, который может помочь в принятии решений. Вместо того, чтобы просто отдавать команды, пассажир может фактически говорить с беспилотным автомобилем. Предположим, вы присвоили своей автономной машине имя, например Адриана, тогда вы можете сказать своей машине: «Адриана, отвези меня в мою любимую кофейню». Это все еще простое предложение для понимания, но мы также можем заставить беспилотный автомобиль понимать еще более сложные предложения, такие как «отвези меня в мою любимую кофейню и, прежде чем добраться туда, остановись у дома Джима и забери его». Есть много других вещей, с которыми вы можете взаимодействовать в своей машине. Однако автомобили с автоматическим управлением не должны слепо подчиняться инструкциям владельца, чтобы избежать любых опасных ситуаций, таких как смертельные и жизненные ситуации. Для этого автономным автомобилям нужен более мощный NLP, который действительно интерпретирует то, что сказали люди, и может отразить последствия этого.

Таким образом, аудиоаналитика на основе машинного обучения объясняется растущей популярностью автономных автомобилей как безопасных и надежных. В VOLANSYS мы помогаем автомобильной промышленности разрабатывать индивидуальные решения на основе технологий машинного обучения, таких как аудиоаналитика, NLP, распознавание голоса и т. д., повышая качество обслуживания пассажиров, безопасность на дорогах и своевременное техническое обслуживание двигателей автомобилей. Наши специалисты по машинному обучению обладают набором навыков для работы с разнообразными формами данных, начиная от чисел, аудио, текста, видео и заканчивая изображениями, с использованием эффективных сред, инструментов анализа данных и визуализации.

Первоначально опубликовано на https://volansys.com/