Вспомогательные технологии, такие как программы чтения с экрана, которые преобразуют текст в звук, прошли долгий путь, но приложения и веб-сайты все еще далеки от инклюзивности.

«Speak Up» — это бесплатный инструмент, который реализует проверенные методы для улучшения чтения людей на любом веб-сайте или в приложении. Он предлагает решения для декодирования текста и изображений для слепых и слабовидящих пользователей, позволяя им слышать свой выбор в графическом пользовательском интерфейсе (GUI). «Speak Up» может читать текст вслух на разных языках.

Возможности:

«Говори» может

  1. Чтение текста вслух
  2. Объясните изображения вместе с описаниями
  3. Обеспечьте голосовую модуляцию
  4. Изменить скорость чтения
  5. Прочитайте текст на большинстве языков.

Это позволяет пользователям слушать текстовые файлы, электронные книги и переведенные тексты.

Спрос на рынке:

В недавней статье Times of India сообщалось, что людям с нарушениями зрения сложно получить доступ к веб-сайтам. Большинство веб-сайтов не поддерживают программы чтения с экрана. Каждый веб-сайт теперь сопровождается изображениями и описанием, и люди с нарушениями зрения не могут понять это, если только это не будет объяснено третьей стороной. людям с нарушениями зрения сложно ориентироваться на сайте.

Благодаря «SpeakUp» людям с нарушениями зрения не потребуется чья-либо помощь для посещения веб-сайта, поскольку они смогут прочитать каждый текст, записанный в файле.

Соответствующие продукты на рынке:

В Интернете доступно множество классических движков преобразования текста в речь, таких как SVOK, TalkBack, BrailleBack, JustSpeak и многие другие, но, поскольку они базируются в США, они довольно дороги в других странах. Кроме того, средства чтения с экрана не могут описать каждый текст в файле, а на некоторых веб-сайтах даже не запущены приложения для преобразования текста в речь.

Целевая аудитория:

«Speak Up» можно использовать где угодно, даже во время путешествий, чтобы повысить свою продуктивность.

Он также может быть использован аудиалами, которые учатся, слушая и слушая информацию.

Основными целевыми клиентами являются люди с нарушениями зрения, которые хотят продолжать учиться, несмотря на свой возраст или инвалидность.

Требуемая технология:

Знание языков программирования, таких как python, или любого другого языка, который мне удобен.

Аудиодрайверы — это тип компьютерных файлов, используемых операционной системой компьютера для распознавания и правильного взаимодействия с аудиоустройством.

оптическое распознавание символов позволяет преобразовывать отсканированные изображения в текст. Можно выделить текст, скопировать его в другие документы или переписать весь раздел. Мы также можем преобразовать их в аудиофайлы с естественным звучанием. Также классификатор нейронной сети в системе OCR быстр и легко обучаем.

синтезаторы речи для искусственного воспроизведения человеческой речи.

Аудиофильтры, чтобы можно было слышать автоматизированную речь в той конфигурации, в которой им удобно и комфортно.

функции перевода, чтобы процесс обучения не ограничивался языковым барьером.

Мое решение:

Примечание. Если мы используем оптическое распознавание символов непосредственно на изображении, оно не будет идентифицировать текст. Вот почему важен формат оттенков серого.

Расчетный бюджет:

Python, Java и большинство языков программирования имеют открытый исходный код и их можно загрузить бесплатно. Кроме того, не требуется никаких средств для загрузки открытого исходного кода на такие сайты, как GitHub или Source Forge.

Единственная инвестиция, которую я должен сделать, — это время, чтобы завершить проект и сделать его доступным как можно большему количеству людей.

Цены продукта:

Механизмы преобразования текста в речь, такие как SVOK, Natural Reader, Amazon Polly и т. д., имеют очень успешные продукты, но, поскольку они базируются в США, они довольно дороги в других странах. В Индии проживает треть слепого населения мира. Многие люди с нарушениями зрения не могут позволить себе использовать приложения для преобразования текста в речь, поэтому я хочу, чтобы мой новый и улучшенный продукт был продуктом с открытым исходным кодом, доступным для всех, кто использует любое электронное устройство и хочет учиться, несмотря на свою инвалидность.

Маркетинговый план:

Многие люди с нарушениями зрения требуют программного обеспечения, которое поможет им перемещаться по веб-сайтам, объясняя изображения вместе с текстом.

1) Я планирую загрузить «SpeakUp» на GitHub как бесплатный продукт с открытым исходным кодом, доступный для всех, кто хочет научиться учиться, независимо от их возраста или инвалидности.

2) Я также планирую загрузить свой продукт на веб-сайты, такие как Kickstarter, которые поощряют краудфандинг для творческих проектов.

3) Связаться с НПО, чтобы провести опрос в школе для слабовидящих детей или доме престарелых и помочь мне в разработке моего заявления.

4) Если «SpeakUp» получит положительные отзывы, я планирую нанять профессионала для разработки графического пользовательского интерфейса, доступного для людей с нарушениями зрения.

5) В ближайшее время планирую выпустить улучшенные версии.

Анализ рисков:

В Индии насчитывается более 10 миллионов слепых, что делает Индию домом для одной трети слепого населения мира. Многие компании продолжают разрабатывать продукты, помогающие людям с нарушениями зрения. Любое программное обеспечение от авторитетной компании, такой как Amazon или Microsoft, которая может объяснить любое изображение с помощью текста, скорее всего, затмит мой продукт.

Кроме того, любой продукт с лучшими характеристиками и функционированием может выйти на новый уровень и скрыть «SpeakUp».

Этап и график:

Серверную часть можно запрограммировать за несколько недель.

Я могу запустить кампанию на Kickstarter для поощрения краудфандинга и связаться с несколькими учреждениями для тестирования приложения.

Маркетинг можно делать одновременно, размещая его в социальных сетях.

Выпуск конечного продукта займет около месяца.