Вспомогательные технологии, такие как программы чтения с экрана, которые преобразуют текст в звук, прошли долгий путь, но приложения и веб-сайты все еще далеки от инклюзивности.
«Speak Up» — это бесплатный инструмент, который реализует проверенные методы для улучшения чтения людей на любом веб-сайте или в приложении. Он предлагает решения для декодирования текста и изображений для слепых и слабовидящих пользователей, позволяя им слышать свой выбор в графическом пользовательском интерфейсе (GUI). «Speak Up» может читать текст вслух на разных языках.
Возможности:
«Говори» может
- Чтение текста вслух
- Объясните изображения вместе с описаниями
- Обеспечьте голосовую модуляцию
- Изменить скорость чтения
- Прочитайте текст на большинстве языков.
Это позволяет пользователям слушать текстовые файлы, электронные книги и переведенные тексты.
Спрос на рынке:
В недавней статье Times of India сообщалось, что людям с нарушениями зрения сложно получить доступ к веб-сайтам. Большинство веб-сайтов не поддерживают программы чтения с экрана. Каждый веб-сайт теперь сопровождается изображениями и описанием, и люди с нарушениями зрения не могут понять это, если только это не будет объяснено третьей стороной. людям с нарушениями зрения сложно ориентироваться на сайте.
Благодаря «SpeakUp» людям с нарушениями зрения не потребуется чья-либо помощь для посещения веб-сайта, поскольку они смогут прочитать каждый текст, записанный в файле.
Соответствующие продукты на рынке:
В Интернете доступно множество классических движков преобразования текста в речь, таких как SVOK, TalkBack, BrailleBack, JustSpeak и многие другие, но, поскольку они базируются в США, они довольно дороги в других странах. Кроме того, средства чтения с экрана не могут описать каждый текст в файле, а на некоторых веб-сайтах даже не запущены приложения для преобразования текста в речь.
Целевая аудитория:
«Speak Up» можно использовать где угодно, даже во время путешествий, чтобы повысить свою продуктивность.
Он также может быть использован аудиалами, которые учатся, слушая и слушая информацию.
Основными целевыми клиентами являются люди с нарушениями зрения, которые хотят продолжать учиться, несмотря на свой возраст или инвалидность.
Требуемая технология:
Знание языков программирования, таких как python, или любого другого языка, который мне удобен.
Аудиодрайверы — это тип компьютерных файлов, используемых операционной системой компьютера для распознавания и правильного взаимодействия с аудиоустройством.
оптическое распознавание символов позволяет преобразовывать отсканированные изображения в текст. Можно выделить текст, скопировать его в другие документы или переписать весь раздел. Мы также можем преобразовать их в аудиофайлы с естественным звучанием. Также классификатор нейронной сети в системе OCR быстр и легко обучаем.
синтезаторы речи для искусственного воспроизведения человеческой речи.
Аудиофильтры, чтобы можно было слышать автоматизированную речь в той конфигурации, в которой им удобно и комфортно.
функции перевода, чтобы процесс обучения не ограничивался языковым барьером.
Мое решение:
Примечание. Если мы используем оптическое распознавание символов непосредственно на изображении, оно не будет идентифицировать текст. Вот почему важен формат оттенков серого.
Расчетный бюджет:
Python, Java и большинство языков программирования имеют открытый исходный код и их можно загрузить бесплатно. Кроме того, не требуется никаких средств для загрузки открытого исходного кода на такие сайты, как GitHub или Source Forge.
Единственная инвестиция, которую я должен сделать, — это время, чтобы завершить проект и сделать его доступным как можно большему количеству людей.
Цены продукта:
Механизмы преобразования текста в речь, такие как SVOK, Natural Reader, Amazon Polly и т. д., имеют очень успешные продукты, но, поскольку они базируются в США, они довольно дороги в других странах. В Индии проживает треть слепого населения мира. Многие люди с нарушениями зрения не могут позволить себе использовать приложения для преобразования текста в речь, поэтому я хочу, чтобы мой новый и улучшенный продукт был продуктом с открытым исходным кодом, доступным для всех, кто использует любое электронное устройство и хочет учиться, несмотря на свою инвалидность.
Маркетинговый план:
Многие люди с нарушениями зрения требуют программного обеспечения, которое поможет им перемещаться по веб-сайтам, объясняя изображения вместе с текстом.
1) Я планирую загрузить «SpeakUp» на GitHub как бесплатный продукт с открытым исходным кодом, доступный для всех, кто хочет научиться учиться, независимо от их возраста или инвалидности.
2) Я также планирую загрузить свой продукт на веб-сайты, такие как Kickstarter, которые поощряют краудфандинг для творческих проектов.
3) Связаться с НПО, чтобы провести опрос в школе для слабовидящих детей или доме престарелых и помочь мне в разработке моего заявления.
4) Если «SpeakUp» получит положительные отзывы, я планирую нанять профессионала для разработки графического пользовательского интерфейса, доступного для людей с нарушениями зрения.
5) В ближайшее время планирую выпустить улучшенные версии.
Анализ рисков:
В Индии насчитывается более 10 миллионов слепых, что делает Индию домом для одной трети слепого населения мира. Многие компании продолжают разрабатывать продукты, помогающие людям с нарушениями зрения. Любое программное обеспечение от авторитетной компании, такой как Amazon или Microsoft, которая может объяснить любое изображение с помощью текста, скорее всего, затмит мой продукт.
Кроме того, любой продукт с лучшими характеристиками и функционированием может выйти на новый уровень и скрыть «SpeakUp».
Этап и график:
Серверную часть можно запрограммировать за несколько недель.
Я могу запустить кампанию на Kickstarter для поощрения краудфандинга и связаться с несколькими учреждениями для тестирования приложения.
Маркетинг можно делать одновременно, размещая его в социальных сетях.
Выпуск конечного продукта займет около месяца.