Что вам нужно знать о будущем преобразования текста в речь.

Спрос на преобразование текста в речь (TTS) растет, и варианты использования выходят за рамки программ чтения с экрана и вспомогательного чтения. За последние несколько лет машинное обучение значительно приблизило синтетический голос к человеческой речи. Это улучшает впечатления слушателей, однако не полностью скрывает жуткий роботизированный голос, но в самом ближайшем будущем вы вряд ли отличите машину от человека.

Естественные голоса

Голоса TTS также могут воспроизводить согласованное произношение. Это может помочь изучающим язык. TTS с машинным обучением в долгосрочной перспективе дорого обходится программам чтения с экрана. Однако по мере снижения стоимости вычислительной мощности в самом ближайшем будущем смартфоны и ноутбуки будут иметь более естественные средства чтения с экрана, встроенные в программное обеспечение. Выделенные чипы машинного обучения станут нормой для создания естественных голосов. Это позволит большему количеству людей иметь доступ к высококачественным естественным голосам. Нынешние программы чтения с экрана в Macbook OS и Windows по-прежнему звучат роботизированно и монотонно. Это по-прежнему многих раздражает некоторых людей и портит их работу в Интернете. И наоборот, естественные голоса обеспечат значительно улучшенный пользовательский опыт.

Пользовательские голоса

Умные домашние устройства; они тоже разговаривают. Бытовая техника может информировать пользователей об изменениях статуса. Например, робот-пылесос может сказать вам, когда пора заряжаться или когда он застревает где-то в комнате. Он мог бы сказать «Я застрял, пожалуйста, помогите мне», вместо звуковых сигналов.

В Железном человеке Джарвис — помощник Тони Старка по искусственному интеллекту. Можем ли мы когда-нибудь иметь свой собственный ДЖАРВИС? Конечно. Голоса также можно было персонализировать; индивидуальный голос, чтобы помочь вам в повседневных потребностях или даже поговорить с вами. Это особенно полезно для людей, у которых есть право голоса из-за таких заболеваний, как боковой амиотрофический склероз (БАС). Это заболевание двигательных нейронов, которое вызывает гибель нейронов, контролирующих произвольные мышцы, такие как язык, руки и ноги. Это та же самая болезнь, которая поразила доктора Стивена Хокингса. Он полагался на устройство для генерации речи, созданное Intel. Об этом подробнее здесь".

Улучшение жизни

БАС лишил многих людей способности говорить. Ассоциация БАС сотрудничает со стартапом Lyrebird для работы над некоммерческой инициативой под названием Project Revoice. Их миссия состоит в том, чтобы люди с БАС не страдали после того, как их голоса были украдены. Они будут работать с пациентами с БАС, чтобы создать цифровой клон их голоса, цель которого — полностью воссоздать уникальную сущность, нюансы и акцент любого человека.

Преобразование текста в речь может помочь спикерам и актерам озвучивания подготовить свои речи. Но это не заменит полностью их искусство, как семинары, проповеди, устные выступления. На данный момент качество голосов ИИ не может имитировать душу человека, поскольку им не хватает идентичности.

Мотивационные речи – это искусство. Текущая задача состоит в том, чтобы машины стали творческими и создали свой собственный стиль. Существует стандартизированный редактор, который позволяет выделять определенные слова и изменять высоту и скорость предложений. Это по-прежнему не добавляет характера голосу машины, но приятно осознавать, что у этой технологии есть потенциал. Технология должна будет регулироваться по мере ее совершенствования. Клонирование голоса действительно вызывает озабоченность по поводу этики. Плохие яблоки будут злоупотреблять этой технологией, например, для голосового фишинга, но преимущества перевешивают недостатки.

Преобразование текста в речь должно быть доступно для всех, поэтому Verby был создан. Его простой пользовательский интерфейс позволяет посетителям легко преобразовывать текст в речь. Создайте аккаунт и получите 1000 символов бесплатно.

Попробуйте Verby.co сейчас