Введение:

Технология распознавания речи (SRT) — это программное обеспечение, которое широко используется в большинстве «умных» устройств. Появление Siri от Apple вызвало ажиотаж вокруг этого предприятия и познакомило пользователей с этой технологией на кончиках пальцев. SRT улавливает высказывания говорящего и переводит их в осмысленный текст (1). Siri, Cortana и Google Now — все это основные формы технологий этого типа, но также могут быть реализованы более эффективные решения в будущем. Были изучены приложения SRT в здравоохранении, которые в настоящее время используются в качестве интерфейса или инструмента для диктовки. Дальнейшие достижения в настоящее время изучаются путем применения вычислительных и статистических инструментов для превращения SRT в инструмент для скрининга речевых и связанных с языком заболеваний, таких как слабоумие и болезнь Альцгеймера, исследовательскими группами в Университете Торонто, а также в IBM. В этой статье утверждается, что SRT будет иметь значение для скрининга и / или помощи в диагностике пациентов с деменцией или другими заболеваниями, нарушающими речь, но в ближайшем будущем она столкнется с проблемами, связанными с рынком. Текущие исследования в области искусственного интеллекта и статистики показывают оптимистичные и многообещающие применения СТО для обнаружения речи у людей с ограниченными возможностями. Рыночное пространство является сложным из-за высоких затрат, но создает низкую конкуренцию и восходящий рост рынка. Текущие исследовательские группы и стартапы продвигают современные технологии для большего количества приложений в здравоохранении, демонстрируя использование SRT в здравоохранении. Общественность не знает об успехах, достигнутых в распознавании речи, но существует потенциал для положительного общественного восприятия. Наконец, прогнозируется, что технологические достижения, необходимые для того, чтобы продукты в этой области приносили прибыль, произойдут в долгосрочной перспективе, а не в ближайшем будущем.

Область текущего исследования SRT

Во-первых, текущие и продолжающиеся исследования закладывают прочную основу для применения распознавания речи в качестве диагностического инструмента. Исследования в области распознавания речи можно разделить на четыре категории: диалог человека с человеком, монолог человека с человеком, диалог человека с машиной и монолог человека с машиной (1). В то время как много ресурсов было сосредоточено на разработке программного обеспечения, которое облегчает преднамеренное взаимодействие человека с машиной, включая одностороннее и двустороннее взаимодействие, последние достижения направлены на разработку большего количества приложений для пассивного извлечения информации из высказывания (1). Одним из таких примеров является использование интерпретации высказываний для диагностики таких расстройств, как слабоумие, или даже рака, такого как рак гортани (1). Некоторые неврологические и интеллектуальные расстройства влияют на голос (2). Например, исследования показали, что у пациентов с распространенными синдромами деменции наблюдаются нарушения обработки голоса с различными профилями дефицита голоса при разных заболеваниях (2). Исследования, проводимые по извлечению речи у людей с заболеваниями, связанными с ухудшением речи, могут быть основаны на продвинутых SRT.

Развитие искусственного интеллекта (ИИ) — это фактор, облегчающий исследования в области распознавания речи и способствующий его применению в продуктах здравоохранения. В текущей области большинство СТО используют скрытые модели Маркова и смешанные модели Гаусса, полученные из теории вероятностей. Недавно было замечено, что новые открытия в области глубоких нейронных сетей дают лучшие результаты, чем модели Гаусса, при тестировании с эталонными показателями распознавания речи, такими как большие словари и наборы данных (3). Искусственные нейронные сети, названные в честь биологических нейронов, представляют собой инструмент, используемый в машинном обучении для исследования сетей больших и абстрактных данных и распознавания образов (4). Нейронные сети продемонстрировали успехи в распознавании образов и машинном обучении, которые позволяют SRT на основе ИИ прогнозировать и облегчать распознавание речи. Недавно обнаруженной альтернативой глубоким нейронным сетям являются сверточные нейронные сети, которые работают лучше, чем глубокие нейронные сети, когда им даются задачи, связанные с распознаванием непрерывной речи с большим словарным запасом (5). Мощь глубокой нейронной сети поддерживается прогрессом в алгоритмах машинного обучения и модернизацией аппаратного обеспечения.3 Исследовательская группа IBM взялась за эту задачу здравоохранения по обнаружению изменений высказываний. Они разработали прототип сервера транскрипции, который автоматически расшифровывает речевой контент, полученный с помощью недорогого оборудования. Затем инструмент машинного обучения выполняет автоматический анализ голоса для определения ключевых характеристик, указывающих на деменцию, таких как качество голоса, непрерывность и беглость речи, а также семантика, включая анализ словарного запаса (6). Исследования в этих вычислительных и статистических областях позволят машинам лучше идентифицировать незначительные изменения в речевых паттернах, которые наблюдаются при раннем развитии деменции или болезни Паркинсона, а также при других заболеваниях, связанных с речью.

Исследования в области машинного перевода также являются важной областью для помощи пациентам с нарушениями речи. Его можно использовать для личной помощи, чтобы понять нетрадиционное высказывание людей с нарушениями речи, включая пациентов с инсультом, умственной отсталостью и деменцией, когда пациенты не могут передать сообщение с хорошими вокальными и семантическими качествами. В интервью доктору Франку Рудзичу, профессору вычислительной лингвистики в Университете Торонто, изучающему искусственный интеллект, он сказал, что использование ИИ для интерпретации нарушенной семантики является очень многообещающей областью, поскольку большие данные будут использоваться для анализа продиктованной речи, подбора ключевым элементом речи и перевести сообщение в фразы, которые теперь может понять другой человек. Возможно, самым большим прорывом для SRT является его потенциал в качестве диагностического инструмента, поскольку текущие последствия были сосредоточены на замене текста. При нейродегенеративных заболеваниях, таких как деменция и болезнь Паркинсона, раннее выявление затруднено, если симптомы не являются тяжелыми (7). Автоматическое распознавание речи может использовать дефекты речи, упомянутые ранее, в качестве маркера, чтобы обеспечить раннюю диагностику, когда тонкие изменения речи могут быть незаметны для врачей. Исследование, в котором участвовал д-р Рудзиц, достигло 81% точности в дифференциации между здоровыми людьми из контрольной группы и пациентами с болезнью Альцгеймера на основе кратких языковых записей участников описания изображений (8). В двух исследованиях болезни Паркинсона с использованием голосовых записей эмоциональной речи и повторяющейся фонации была получена точность 73,33% и 75,2% при различении контрольной группы и пациентов соответственно (7,9). Это исследование показало, что больше исследований посвящено разработке приложений для внедрения ИИ в здравоохранение. В целом, эти технологии закладывают основу для потенциальных продуктов, которые можно применять в клинических условиях.

Анализ рынка и конкуренции

Поскольку продукты для распознавания речи, которые выявляют деменцию или речевые патологии на ранних стадиях, еще не представлены на рынке, можно назвать несколько конкурентов. Модель пяти сил Портера демонстрирует, что рынок все еще находится в зачаточном состоянии, и будущее распознавания речи как инструмента, помогающего в диагностике деменции, еще предстоит увидеть. С другой стороны, ожидается, что к 2024 году общая стоимость отрасли распознавания речи составит 5,1 миллиарда долларов (23). Существует несколько причин слабой конкуренции на рынке распознавания речи, ориентированного на здравоохранение, при этом высокие затраты на исследования и разработки являются решающим фактором. Nuance, компания, которая предлагает распознавание речи для докторских медицинских исследований, ежегодно инвестирует 100 миллионов долларов в исследования и разработки (10). Кроме того, опыт требуется от экспертов из разных дисциплин, таких как информатика, инженерия и неврология. Высокие затраты денег и времени на исследования и разработки создают барьер для выхода на рынок компаний, желающих выйти на рынок распознавания речи в здравоохранении. Из-за высоких капитальных затрат существует цена сдерживания входа, при которой новые конкуренты могут быть сдерживаемы, поскольку первоначальная прибыль, скорее всего, будет меньше, чем стоимость выхода на рынок. Кроме того, по данным опроса ( Приложение, рис. 5) общественность принимает использование СРТ для оказания помощи или выявления заболеваний, поскольку люди привыкли к традиционной диагностике с помощью врач в больнице. Тем не менее, технология помощи в диагностике болезни Альцгеймера на ранней стадии не может быть устойчивой, поскольку один диагноз приходится на одного пациента, хотя эту технологию можно использовать в качестве дополнительного инструмента для анализа состояния здоровья пациента. Вопросы регулирования также создают барьер для выхода на рынок, требуя одобрения FDA любого продукта, который помогает диагностировать или смягчить заболевание, для получения которого часто могут потребоваться годы исследований и клинических испытаний (11). Учитывая, что все эти факторы создают высокий барьер для входа, в ближайшем будущем рынок столкнется с проблемами, связанными с привлечением новых компаний, поскольку поток доходов недостаточно развит, в результате чего на рынке остается мало заметных конкурентов.

С другой стороны, низкая конкуренция на большом рынке диагностики деменции на ранних стадиях может привлечь потенциальные технологии для выхода на рынок. По данным Общества Альцгеймера Канады, к 2030 году число пациентов с болезнью Альцгеймера может увеличиться до 1,4 миллиона человек, а к 2040 году их стоимость составит 293 миллиарда долларов в год (12). Доступность автоматического распознавания речи (ASR) значительно снизит затраты на пациента, что более важно, поможет с более ранней диагностикой болезни Альцгеймера, поскольку ASR является простым, быстрым и недорогим (13). Хотя соответствующие продукты ASR еще не были представлены на рынке здравоохранения, текущие исследования показали многообещающее будущее распознавания речи в качестве помощника в ранней диагностике деменции. В рамках четырехлетнего проекта IBM Research-Haifa, объединенного с Dem@Care, разрабатывается интегрированная система датчиков для диагностики деменции и последующего лечения путем измерения состояния пациента в домашних условиях (6). Система Watson, разработанная IBM, способна получать доступ к состоянию пациента, обнаруживая закономерности в голосовых записях. Данные, полученные от системы, используются для оценки эффективности лечения пациента, выявления признаков симптомов деменции в речи, а также для поддержки принятия решений по профилактической помощи. Например, система анализирует состояние здоровья пациента и обратную связь с врачом в качестве справочной информации для более точного суждения о рецептах и ​​методах лечения (6, 14). Текущие исследования сделали большой шаг вперед для продукта распознавания речи на рынке здравоохранения для раннего выявления деменции. Каждый год во всем мире значительно увеличивается число пациентов с деменцией, поэтому рынок ожидает возрождения и расширения по мере совершенствования технологии ASR.

Современные тенденции в технологии распознавания голоса

Технология распознавания речи была реализована стартапами и исследователями в качестве персональной помощи в различных медицинских учреждениях, что свидетельствует об оптимизме рынка и общественном признании. Предоставление медицинских услуг населению с помощью интеллектуальных личных помощников на мобильных устройствах с голосовыми пользовательскими интерфейсами было в центре внимания многих начинающих компаний, что позволило повысить доступность, поддержку пациентов и рентабельность поставщиков. Sense.ly, запущенная в 2014 г., представляет собой виртуальную клиническую платформу, которая позволяет персонализировать уход за пациентами и отслеживать заболевания между визитами в больницу и после выписки (15). Виртуальная медсестра Молли отслеживает самочувствие пациентов с помощью анкет, используя распознавание речи, клинические измерения и жизненно важные органы, а также напоминания о приеме лекарств и посещениях. Клиницисты используют собранные данные для настройки индивидуального ухода, просмотра видео или оценки рисков для повторной госпитализации, если это необходимо. Другим примером является британская компания Babylon Health, которая разработала приложение на основе ИИ, запущенное ранее в этом месяце, позволяющее озвучивать медицинские вопросы и оперативно получать ответы от медицинских работников (16). Он также предоставит возможные варианты действий на основе описанных симптомов, сопоставив их со своей базой данных, а также с личной историей болезни (17). В сочетании с дополнительными функциями для видеоконсультаций с врачами и доставки рецептов в близлежащие аптеки стартап привлек известных инвесторов, таких как основатели Google DeepMind (16, 17). Sense.ly и Babylon демонстрируют применимость и преимущества распознавания речи в контексте здравоохранения, стимулируя непрерывный рост и внедрение, а также повышение общественного признания технологии в системе здравоохранения.

Появление персональных вспомогательных средств, использующих распознавание речи для удовлетворения потребностей людей с ограниченными возможностями, также демонстрирует потенциал расширения и диверсификации рынка, а также повышения общественного признания за счет целевых пользователей. Transcense стремится помочь 360 миллионам людей с нарушениями слуха во всем мире преодолеть коммуникативные барьеры, разработав первое аудиовизуальное пособие Ava (18). Подобно ранее упомянутым компаниям, этот стартап использует распознавание речи на мобильных устройствах, что обеспечивает большую доступность и визуализацию разговора для слабослышащих людей. Между участниками может быть достигнута эффективная коммуникация, особенно в большой группе, где легко потерять нить разговора. Альтернативным применением распознавания речи в здравоохранении является удовлетворение особых потребностей и обеспечение долгосрочного ухода на дому за пожилыми людьми с помощью персонального робота-помощника. Исследовательская группа под руководством доцента доктора Франка Рудзича из Университета Торонто разрабатывает мобильного робота «ЭД», который будет помогать пациентам с болезнью Альцгеймера в повседневной деятельности посредством распознавания речи и визуальных подсказок (19). общение между человеком и роботом показало, что технические аспекты распознавания речи являются основным ограничением. Причины этого включают языковые различия у пожилых людей, а также нарушения речи и общения у пациентов с деменцией. Хотя эксперимент показал, что применение мобильного робота по-прежнему требует дальнейших исследований и улучшений, он может привести к прогрессу как в технологии, так и в системе здравоохранения. Таким образом, разработка разнообразных приложений распознавания речи для оказания помощи целевому населению в удовлетворении их потребностей, а также существующее предоставление медицинских услуг населению с помощью персонального помощника на основе распознавания речи на мобильных устройствах свидетельствуют об оптимистичной восходящей тенденции на рынке. .

Восприятие общественности и потребителей

Росту рынка препятствует общественное мнение о СТО и ее значении в здравоохранении. Опасения потребителей связаны с точностью и доверием, при этом предпочтение отдается личному общению в медицинских учреждениях. Общественное восприятие СТО сильно сосредоточено на точности, а не на ее практическом текущем и потенциальном использовании, вероятно, из-за недостатка знаний о существующих и развивающихся технологиях. На основе нерандомизированного опроса 100 человек (в основном студентов университетов) 89% из них имеют доступ к SRT (например, Siri, Cortana и Google Now) ( Приложение, рис. 1). Из этих 89 человек 42 сообщили, что никогда не использовали SRT на своих устройствах (приложение, рис. 2). Это определяет большую и неиспользованную популяцию, на которую можно было бы ориентироваться для создания позитива и принятия. Те, кто использует встроенные голосовые функции на своих устройствах, сделали это для удобства. На вопрос, будут ли люди использовать речевое медицинское приложение, 57% ответили да, а 43% сказали нет. Основной причиной использования приложения было сокращение затрат и экономия времени, а основной причиной отказа от его использования было предпочтение практикующего врача ( Приложение, рисунки 5, 6). Эти тенденции указывают на то, что потребители готовы использовать приложения, которые предоставляют медицинские советы или инструкции, но в настоящее время могут не доверять точности информации или не чувствовать себя комфортно при взаимодействии. Существуют общественные заблуждения относительно СТО, которые необходимо устранять по мере развития этих технологий.

Восприятие SRT потребителем и общественностью станет восприимчивым, как только на рынке появится больше полезных приложений, связанных с речью. Существует повышенная потребность в предоставлении пациентам и их семьям наилучшего ухода, чтобы сократить время, проводимое в больницах и домах престарелых для пожилых людей. Цель здесь состоит в том, чтобы использовать SRT для облегчения ухода за пожилыми людьми и обеспечения более интерактивного здравоохранения, чтобы снизить нагрузку на клиники и больницы. Это также помогает врачам принимать обоснованные решения и помогает улучшить качество жизни пожилых людей, их семей и общества.6 Согласно исследованию, 61% врачей, использовавших ЗТ, указали, что она улучшила ведение документации, а 51% сообщили, что она сэкономит время, принесет пользу пациентам и приведет к более эффективному уходу, тем самым способствуя простоте использования (20). Другое исследование пришло к выводу, что основным преимуществом вспомогательной СРТ является экономическая эффективность и эффективность. В исследовании также сообщается, что SRT обладает высоким потенциалом совместимости со смартфонами и способностью дифференцироваться. Единственной проблемой была доступность такой технологии (21). Возможность снизить затраты и повысить эффективность будет стимулом для более широкого использования речевых технологий. Доктор Мунтяну, профессор компьютерных наук в Университете Торонто, надеется увидеть в ближайшие годы широкое общественное признание технологий, связанных с речью, а также социальных движений роботов, которые облегчат общение с ними. . Следовательно, SRT имеет множество приложений, а маркетинг и повышение доступности такой технологии могут активно увеличивать количество пользователей и в конечном итоге иметь положительные последствия для рынка.

Будущие последствия и прогноз

В будущем SRT станет привлекательным рыночным предприятием после того, как исследования его применения в здравоохранении будут подтверждены. Технологии и исследования, следующие за диагностическим применением в случаях этих заболеваний в клинических условиях, вполне могут появиться на рынке в течение следующих двух лет. До сих пор СТО в сфере здравоохранения требовала от врачей обучения тому, как «разговаривать» с компьютером, чтобы система могла его понять, что вынуждало врачей знакомиться, меняя манеру речи и медленно адаптируясь к системе (22). ). Однако из-за быстрого технического прогресса в системах SRT можно прогнозировать, что будущие системы распознавания речи будут содержать большое количество встроенного словаря и могут быть запрограммированы на распознавание всех типов технологической и научной терминологии медицинской профессии. Вскоре СРТ сможет учиться, «слушав» врача благодаря достижениям в распознавании образов и статистике. Преодоление технических проблем с помощью интенсивных исследований поможет продвинуться вперед в этой области.

Можно также прогнозировать различные приложения SRT в медицинских учреждениях. Сегодня, когда непрерывные речевые диктовки стали очень распространены в СТО, методы мультимодальной коррекции ошибок также получили развитие как решение для исправления ошибок распознавания. По словам доктора Мунтяну, мультимодальная коррекция ошибок может стать чрезвычайно полезной в СТО для компенсации ошибок. Существующая на рынке технология диктовки не позволяет пользователю вернуться назад и «отредактировать» ошибку. Исследования в области исправления ошибок повысят удобство использования SRT. Еще одним потенциальным приложением, которое может быть реализовано в медицинских учреждениях, является SRT, которое может дополнять взаимодействие врача и пациента. Доктор Мунтяну также видит технологию, которая будет распознавать речь на фоне разговора и прерывать разговор, если будет обнаружена врачебная ошибка. Конечно, этот тип технологии пока неосуществим, так как необходимо провести много дальнейших исследований в области распознавания образов и статистики. Доктор Мунтяну не считает, что СТО будет революционной в процессе диктовки записей в будущем. Что касается медицинской диктовки, он говорит, что это только сэкономит время и может быть «полезно в клинических условиях, потому что это более гигиеничный и бесконтактный способ ведения дел». Такие приложения могут быть направлены на облегчение жизни пользователя, удобно выполняя вычислительные требования или диктуя, когда пользователь произносит их вслух. В целом, будущее распознавания речи в здравоохранении выглядит оптимистично, если СТО будет заниматься доступностью, диагностикой и улучшением взаимодействия между врачом и пациентом.

В ближайшем будущем разработки в области СТО, вероятно, помогут решить проблемы, с которыми сталкиваются люди с деменцией и болезнью Альцгеймера. Несмотря на то, что вспомогательный робот и распознавание речи, ориентированные на быстрорастущее стареющее население, все еще находятся на ранней стадии разработки, наряду с Ava, которая удовлетворяет потребности в общении, существуют потенциальные последствия этой технологии для людей с деменцией или другими заболеваниями, нарушающими речь. и технология достаточно зрелая, чтобы выйти на рынок. С ростом мощности облачной обработки больших данных и тем фактом, что машинная интерпретация человеческого высказывания становится все более зрелой, можно прогнозировать, что в течение двух-пяти лет технология распознавания голоса, используемая для диагностики заболеваний, связанных с голосом, будет совершенствоваться. присутствующих на рынке, как технология IBM, упомянутая ранее. Его также можно интегрировать в устройства в кабинетах врачей, работающие в фоновом режиме для записи человеческой речи. Он будет взаимодействовать с людьми, чтобы предупреждать об обнаружении ранних признаков голосовых патологий. Диагностика языковых патологий с помощью этой технологии оставит работу машинам, что сэкономит время, которое в противном случае было бы потрачено на лечение пациентов или мониторинг для выявления болезненных состояний. В целом, исследования в области СТО в приложениях, связанных с деменцией, будут быстро развиваться.

Заключительные замечания

В заключение можно сказать, что SRT, используемый для скрининга и диагностики пациентов с деменцией и другими заболеваниями, связанными с речью, подает надежды, но в настоящее время рынок не приветствует эти технологии. Исследования, проведенные в области искусственного интеллекта, а именно машинного обучения и распознавания речи при слабоумии, дали хорошие результаты, которые можно применить, но в настоящее время выход на рынок затруднен из-за высоких затрат, несмотря на низкую конкуренцию. Коммерциализированные технологии и стартапы применяют СТО на практике, что свидетельствует об оптимизме и успехе. Некоторые заблуждения общественности и пользователей связаны с перспективностью и точностью такой технологии, но есть готовность ее принять. В ближайшем будущем в этой области будет наблюдаться больше достижений, основанных на исследованиях, и на рынке постепенно появятся приложения, связанные с деменцией. В целом ожидается, что в ближайшие годы рынок распознавания речи, ориентированный на слабоумие, будет расти.

Авторы: Бянь Сяобо, Каника Сингхал, Сабрина Шилун Фанг, Шанкар Шьям Кришна, Вайдехи Патель, Вэнь-Чиен (Дженни) Сяо

Под руководством доктора Джейсона Паркера, биология человека, Университет Торонто.

Использованная литература:

1. Чоу В., Хуанг Б. Распознавание образов в речи и языковой обработке. Бока-Ратон: CRC Press; 2003.

2. Хейлстоун Дж., Кратч С., Уоррен Дж. Распознавание голоса при деменции. Поведенческая неврология 2010;23(4):163–164.

3. Хинтон Г., Дэн Л., Ю Д. и другие. Глубокие нейронные сети для акустического моделирования при распознавании речи: общие взгляды четырех исследовательских групп. IEEE Signal Process Mag 2012;29(6):82–97.

4. Литтон В. Вычислительная нейронаука. Энциклопедия неврологических наук. 2014;: 844–847.

5. Сайнат Т., Кингсбери Б., Саон Г. и др. Глубокие сверточные нейронные сети для крупномасштабных речевых задач. Нейронные сети 2015; 64:39–48.

6. IBM Research: новый вид лечения деменции [Интернет]. Research.ibm.com. 2016 [цитировано 22 марта 2016 г.]; Доступно по адресу: http://www.research.ibm.com/articles/dementia-treatment-diagnosis.shtml

7. Наранхо Л., Перес С., Кампос-Рока Й., Мартин Дж. Использование репликации записи голоса для выявления болезни Паркинсона. Экспертные системы с приложениями 2016; 46: 286–292.

8. Фрейзер К., Мельцер Дж., Рудзиц Ф. Лингвистические признаки болезни Альцгеймера в повествовательной речи. Журнал болезни Альцгеймера 2015;49(2):407–422.

9. Чжао С., Рудзиц Ф., Карвальо Л., Маркес-Чин С., Ливингстон С. Автоматическое обнаружение выраженных эмоций при болезни Паркинсона. 2014 Международная конференция IEEE по акустике, обработке речи и сигналов (Icassp) 2014;

10. Распознавание речи для здравоохранения | Нюанс [Интернет]. Nuance.com. 2016 [цитировано 22 марта 2016 года]; Доступно по адресу: http://www.nuance.com/for-healthcare/by-solutions/speech-recognition/index.htm.

11. Является ли продукт медицинским устройством? [Интернет]. FDA.gov. 2016 [цитировано 22 марта 2016 г.]; Доступно по адресу: http://www.fda.gov/MedicalDevices/DeviceRegulationandGuidance/Overview/ClassifyYourDevice/ucm051512.htm

12. Число больных деменцией в Канаде | Канадское общество болезни Альцгеймера [Интернет]. Альцгеймер.ca. 2016 [цитировано 22 марта 2016 г.]; Доступно по адресу: http://www.alzheimer.ca/en/About-dementia/What-is-dementia/Dementia-numbers

13. Ласке С., Сохраби Х., Фрост С. и др. Инновационные диагностические инструменты для раннего выявления болезни Альцгеймера. Болезнь Альцгеймера и деменция 2015;11(5):561–578.

14. Сатт А., Сорин А., Толедо-Ронен О., Баркан О., Компациарис И., Коконози А. Оценка речевого протокола для выявления ранней стадии деменции. В: Интерспич. 2013.

15. Sense.ly | Виртуальные визиты, реальная забота. [Интернет]. Sense.ly. 2016 [цитировано 22 марта 2016 г.]; Доступно по адресу: http://sense.ly/

16. Вавилонское здоровье [Интернет]. Вавилон. 2016 [цитировано 22 марта 2016 г.]; Доступно по адресу: http://www.babylonhealth.com/

17. Доктор с искусственным интеллектом сейчас вас услышит [Интернет]. Обзор технологий Массачусетского технологического института. 2016 [цитировано 22 марта 2016 года]; »

18. Ава — Общение без барьеров [Интернет]. Ava.me. 2016 [цитировано 22 марта 2016 г.]; Доступно по адресу: http://www.ava.me/

19. Рудзиц Ф., Ван Р., Бегум М., Михайлидис А. Речевое взаимодействие с персональными вспомогательными роботами, поддерживающими старение в домашних условиях для людей с болезнью Альцгеймера. ACM Trans Access Comput 2015; 7 (2): 1–22.

20. Lyons J, Sanders S, Fredrick Cesene D, Palmer C, Mihalik V, Weigel T. Принятие врачами распознавания речи: временное воспроизведение обзора ожиданий и опыта. Журнал медицинской информатики 2015;

21. Макдональд Р., Томакос Н., Инглис К. Обзор существующих и новых вспомогательных технологий для сокращения часов ухода за больными: экономическая эффективность, инструменты принятия решений и новые практики. Мельбурн: Университет Монаша: 2013.

22. Паренте Р., Кок Н., Сонсини Дж. Анализ внедрения и влияния технологии распознавания речи в секторе здравоохранения. Perspect Health Inf Manag 2004; 1:5.

23. Рынок распознавания речи и голоса достигнет 5,1 миллиарда долларов — FindBiometrics [Интернет]. НайтиБиометрия. 2015 [цитировано 23 марта 2016 г.]; Доступно по адресу: http://findbiometrics.com/speech-voice-recognition-market-to-hit-5-1-billion-26111/

24. Nuance объявляет результаты за 2013 финансовый год и четвертый квартал». Обзор рынка. Проверено 20 мая 2015 г.

25. «Отчет о прибылях и убытках за 4 кв. 2015 ФГ». Майкрософт. 21 июля 2015 г. Проверено 24 июля 2015 г.

26. «Отчеты Apple фиксируют результаты четвертого квартала». Apple Inc. 27 октября 2015 г. Проверено 27 октября 2015 г.

27. Статистика. Google: глобальный годовой доход в 2015 году | Статистика. 2016. Доступно по адресу: http://www.statista.com/statistics/266206/googles-annual-global-revenue/. По состоянию на 2 марта 2016 г.

Все изображения, используемые в этой статье, предоставляют исходную информацию по мере необходимости. Для всех изображений может не требоваться указание авторства. Графики опросов взяты с сайта Surveymonkey.com в соответствии с их условиями использования.

Приложение: