Повышение доступности Интернета с помощью машинного обучения

Взгляните на состояние доступности Интернета сегодня и на то, как машинное обучение может помочь сделать Интернет более доступным для всех.

Вступление

Машинное обучение теперь стимулирует огромное количество повседневных взаимодействий в Интернете. Когда мы используем Netflix, Amazon, Microsoft, Google или любые крупные социальные сети, мы сталкиваемся с алгоритмами машинного обучения (ML), которые помогают обеспечить более богатый и персонализированный пользовательский интерфейс. Хотя мы сознательно не задумываемся о том, что машинное обучение лежит в основе наших программ, оно всегда присутствует.

Но если мы редко думаем об инструменте на основе алгоритма, который управляет какой-то частью нашей повседневной жизни, то еще реже мы задумываемся о том, как эти инструменты влияют на пользователей с ограниченными возможностями. Машинное обучение постоянно используется для улучшения потребительского опыта в целом, но может ли оно сделать больше для улучшения конкретных впечатлений? Например, используются ли возможности этих инструментов для улучшения пользовательского опыта для тех, кто использует вспомогательные технологии? Улучшение автоматизированных средств тестирования доступности? А если нет, то почему? Что мешает нам использовать машинное обучение для большего блага?

Доступность Интернета - важная тема для обсуждения, а машинное обучение - одно из самых захватывающих и обсуждаемых сегодня технологических пространств, поэтому так важно посмотреть, как эти два направления пересекаются, перекрываются и влияют друг на друга. Мы взяли интервью у ряда экспертов по тестированию доступности и адвокации - Sina Bahram, Denis Boudreau, Karl Groves, David MacDonald, Jared Smith и собственный Myplanet Everett Zufelt - чтобы узнайте, что происходит сейчас с точки зрения применения машинного обучения для решения проблем веб-доступности, и получите представление о том, что находится на горизонте.

Эксперты, с которыми мы говорили, говорили о возможностях и идеях для новых алгоритмов и инструментов, которые являются частью того, что мы исследуем в этом документе. Они также рассмотрели приложения веб-доступности для многих популярных типов алгоритмов, некоторые из которых уже интегрированы в вспомогательные технологии. Поскольку эта область все еще нова, мы не будем подробно обсуждать проверенные решения. Вместо этого мы хотим представить возможности на ближайшую и долгосрочную перспективу, чтобы стимулировать обсуждение того, что должно произойти, чтобы решения стали реальностью, и стимулировать действия в этом направлении.

Чтобы структурировать обсуждение, мы разделили этот документ на три раздела: Возможные применения существующих инструментов, в котором рассматривается интеграция текущих алгоритмов машинного обучения с проблемами доступности; Возможности новых инструментов, в котором рассматриваются различные будущие возможности, которые могут быть использованы при разработке новых алгоритмов машинного обучения; и Проблема данных, в которой рассматриваются проблемы, связанные с качеством и количеством данных, доступных для работы этих решений. С этого и начнем наше обсуждение.

Проблема с данными

Существует бесчисленное множество возможностей применить машинное обучение к текущим проблемам доступности Интернета. И помимо применения предварительно обученных алгоритмов, машинное обучение обещает доступность за счет применения совершенно новых типов алгоритмов. Но есть проблема: отсутствие хорошо аннотированных данных. А хорошо аннотированные данные - это топливо для машинного обучения.

Это вопрос, который неоднократно поднимался при обсуждении возможностей с экспертами, и который подробно описывает Сина Бахрам из Prime Access Consulting.

«Когда такая крупная компания, как Google, хочет собрать воедино различные модели - например, модели языка или компьютерного зрения, - у них есть большой объем данных, с которыми можно работать. Мы не говорим о миллионах строк, мы говорим о миллиардах строк. При таком уровне данных легко использовать передовой опыт машинного обучения, чтобы получить довольно хорошие классификаторы », - говорит Бахрам.

Но мы не все можем быть Google, а это значит, что перед нами стоит большая проблема.

«У нас нет набора данных из миллиарда веб-страниц с хорошо аннотированной семантикой», - продолжает он. «Таким образом, возникает вопрос: если мы не собираемся использовать довольно наивный подход к модели данных, при котором у нас есть произвольный ввод и происходит преобразование, то что мы можем сделать? Какие типы вещей мы можем сделать, чтобы решить под-проблемы в пространстве или помочь собрать эти данные или, по крайней мере, предупредить о проблемах, не обязательно имея возможность их исправить? »

Некоторые из наших экспертов указали на возможность использования наблюдений пользователей для построения взаимосвязей данных, необходимых для машинных выводов. Наблюдение за пользователями может принимать форму постоянного крупномасштабного исследования взаимодействий человека и компьютера, связывающего взаимодействия, их контекст, причины, по которым они происходят, и результаты данных.

Но, как указывает Джаред Смит из WAVE, любое исследование взаимодействия с пользователем должно учитывать оптимальное взаимодействие с конечным пользователем различных вспомогательных технологий. Например, группа, состоящая из множества пользователей программ чтения с экрана, может не захотеть, чтобы машина отслеживала их действия, чтобы определять шаблоны их использования. (Чтобы усугубить проблему, нам потребуются разные исследования для разных групп пользователей.)

Карл Гроувс из Tenon обсуждает возможность использования веб-аналитики для сбора пользовательских данных, которые затем можно использовать для обучения алгоритмов машинного обучения. Опять же, нам нужно знать пользователя и его платформу. Данные, которые уже собираются Tenon или другими инструментами тестирования на основе правил, могут использоваться в алгоритмах обучения, с корреляциями, проведенными между данными Tenon, проблемами, обнаруживаемыми машиной, и данными аналитики, которые дадут нам подсказки относительно того, как эти проблемы влияют на пользователя. .

Также есть возможность использовать предварительно обученный алгоритм, чтобы помочь обучить новый алгоритм. Возможно, смоделированный пользователь - концепция, которую мы обсудим немного позже в разделе Моделирование искусственного интеллекта, - сможет перемещаться по веб-сайту с добавлением снимков экрана или видеоанализа для создания искусственных пользовательских данных.

Что касается проблем с данными, то есть открытые вопросы, которые необходимо решить: откуда берутся пользовательские данные? Хотели бы пользователи отслеживать их использование или отмечать веб-страницы? Можно ли обучить машину моделировать взаимодействие с пользователем? Можем ли мы посмотреть на показатели отказов от аналитики, чтобы сделать вывод об ошибках доступности? Существует множество возможностей, которые необходимо изучить, чтобы определить, жизнеспособны ли они и какие данные они будут производить.

Рим был построен не за один день, и вряд ли мы сразу получим ответы на все эти вопросы, но их стоит задуматься. А пока давайте оставим проблему с данными и перейдем к некоторым идеям относительно инструментов на основе машинного обучения, имеющих отношение к веб-доступности.

Возможные применения существующих инструментов

Подписи к изображениям

Описания изображений, созданные искусственным интеллектом, прошли долгий путь. Вначале алгоритмы распознавания изображений давали описания различных компонентов изображения, таких как «две кошки» или «водоем». По мере развития алгоритмов развивались и дескрипторы: «два оранжевых кота играют с пряжей». Однако без контекста даже более подробные описания часто не особенно полезны. Но это может измениться.

Facebook, например, теперь начинает контекстуализировать описания изображений любыми возможными способами, включая пользовательские предпочтения, недавние разговоры и события, связанные с пользователем. Они называют эти машинные описания изображений альтернативным текстом.

Некоторые из наших экспертов по доступности возражают против этой номенклатуры, утверждая, что машина никогда не сможет правильно угадать намерения автора контента. Однако все они согласны с тем, что описание, созданное компьютером, лучше, чем отсутствие описания. И подобные инструменты субтитров, если они включены в автоматизированное тестирование доступности, могут помочь нам в создании альтернативного текста для изображения или выступить в качестве запасного варианта для вспомогательных технологий, когда альтернативный текст недоступен.

Также растет признание того, что существующие системы субтитров к изображениям не особенно хорошо соответствуют потребностям слепых и слабовидящих пользователей. С этой целью Microsoft со своей AI for Accessibility program стала партнером Техасского университета в Остине по Microsoft Ability Initiative, целью которой является создание общедоступного ресурса данных, специально ориентированного на потребности доступности, которые можно использовать для работы инструментов субтитров AI. Этот набор данных станет бесценным ресурсом для интеграции распознавания изображений для обеспечения доступности.

Каждый инструмент автоматического тестирования доступности, представленный в настоящее время на рынке, проверяет, содержит ли изображение альтернативный текст или нет. За счет интеграции с технологией распознавания изображений они могли выполнить тот же тест в тандеме с распознаванием изображений, что позволило бы нам сделать несколько разных, очень эффективных вещей:

Предоставьте предложения для альтернативного текста в сгенерированном отчете
Сравните эти предложения с любым ранее существовавшим замещающим текстом и отметьте его, если точность замещающего текста изображения кажется низкой (так называемый низкий «эквивалент достоверности»).

Некоторые инструменты автоматического тестирования доступности уже используют шкалу «достоверности» для оценки результатов тестирования. Tenon, например, уже использует основанный на правилах метод для определения точности атрибута alt (другими словами, имеет ли контент смысл в контексте?). В этом случае алгоритм распознавания изображений может быть вызван только при низкой уверенности в точности, что ускорит автоматизированный тест за счет меньшего количества обращений к алгоритму.

Существуют вспомогательные технологии, которые уже включают распознавание изображений - JAWS, например, с его функцией распознавания изображений Picture Smart. Эта функция позволяет пользователям отправить изображение для анализа различными службами (такими как Microsoft и Google) и получить доступ к полученным результатам.

Денис Будро из Deque считает, что объединение распознавания изображений с алгоритмом обобщения контента в конечном итоге позволит машинному обучению задавать контекст изображениям на странице, что дает лучшее представление о намерениях автора.

«Любой автоматизированный инструмент прямо сейчас сможет сказать вам, есть ли у изображения атрибут alt. Но ни один инструмент не сможет сказать вам, актуально ли значение атрибута alt в контексте, в котором оно используется », - говорит Будро.

Сегодня люди необходимы для такого рода анализа, но в следующие несколько лет, по мере того, как распознавание изображений улучшается, а абстрактное обобщение текста также становится более надежным, легко представить, как это изменится.

«Мы могли бы очень быстро проанализировать текст, - добавляет Будро, - и посмотреть, несет ли суть этого текста достаточную ценность, чтобы обеспечить контекст для этого изображения на этой странице».

Очевидно, что у объединения существующих алгоритмов со вспомогательными технологиями есть большой потенциал. По мере улучшения алгоритмов повышается и точность описаний изображений. При автоматическом тестировании доступности он будет использоваться для ускорения и упрощения трудоемкой работы по тестированию точности замещающего текста и ручному исправлению.

А как насчет использования распознавания изображений с графическими изображениями? Доступность графиков - серьезная проблема для пользователей с ослабленным зрением. Дэвид Макдональд из CanAdapt обсуждает включение требований к контрастности графики в WCAG 2.1 и возможности использования машинного обучения для облегчения доступа к графике.

«Возьмите гистограмму: если полосы не контрастируют друг с другом должным образом и между полосами нет разделения, она часто нечитаема», - говорит Макдональд. «Худшим примером может служить круговая диаграмма, на которой невозможно различить две части пирога».

Для пользователей с плохим зрением или дальтонизмом это может сделать график бессмысленным. И это проблема, которая может затронуть более 5% среднего населения.

Стоит изучить варианты использования цветового контраста в машинном обучении. Такой тип контрастного анализа изображения, безусловно, возможен с использованием машинного обучения. Но настоящие улучшения произойдут, когда технологии будут объединены: когда мы интегрируем этот анализ с автоматизированными инструментами тестирования доступности или сделаем еще один шаг вперед, когда мы будем использовать машинное обучение для извлечения данных из графики для пользователей программ чтения с экрана.

AI-моделирование пользовательской навигации

ИИ обычно используется в видеоиграх для имитации человеческого взаимодействия. Этот метод часто делает снимки экрана или видео и использует машинное обучение для классификации того, что происходит на снимках экрана, когда ИИ выполняет действия. Эту форму машинного обучения можно назвать глубоким обучением, поскольку она включает несколько уровней ввода. Элементы этого метода можно адаптировать для использования в автоматизированном тестировании доступности.

Есть ошибки доступности, особенно в области доступности клавиатуры, которые трудно проверить с помощью автоматизированных инструментов. Рассмотрим следующий пример: если модальный элемент открывается и получает визуальный фокус, но не получает программный фокус, то пользователь, использующий только клавиатуру, не сможет взаимодействовать с модальным окном и не сможет закрыть модальный. Это типичный пример клавиатурной ловушки.

Джаред Смит говорит, что этот тип проблем обычно требует человеческого зрения, чтобы найти их при тестировании. Но рассмотрите возможность использования ИИ для навигации по веб-страницам с помощью навигации только с клавиатуры, где снимки экрана используются для обратной связи о том, что происходит на экране. Машина могла определить, не могла ли она больше перемещаться, была ли навигация крайне неэффективной или могла ли она перемещаться, но на экране ничего не происходило (как, например, в случае, когда пользователь может перемещаться по экрану). через гамбургер-меню, даже если меню свернуто). Использование искусственного интеллекта для наблюдения за веб-страницей, подобного описанному, может помочь в выявлении проблемы.

Возвращаясь к проблеме цветового контраста, Карл Гроувс отмечает, что это еще одна проблема, которую трудно обнаружить без визуального тестирования, что делает ее еще одним потенциальным кандидатом для моделирования взаимодействия с пользователем и анализа снимков экрана.

«Можно подумать, что цветовой контраст легко определить», - говорит Гровс. «Измерьте цвет переднего плана и фона, а затем обработайте полученные результаты математическим алгоритмом, который измеряет контраст». И хотя это звучит легко и просто, в жизни нет ничего проще.

Что делать, если этот элемент« абсолютно позиционирован ?» он добавляет. Теперь вы не знаете, в какой области контент позиционируется абсолютно или каков цвет фона. Если вы добавите к этому CSS3 переходы, градиенты и анимацию, вы сможете выбросить любые предположения о контрасте за дверь .

Так. В конце концов, не все так просто.

Однако, если бы у нас был ИИ, имитирующий взаимодействие с пользователем и сравнивающий его со снимками экрана, показывающими контраст элементов поверх различных фонов, он потенциально мог бы выявить любые серьезные проблемы с контрастом.

Как только мы начнем обдумывать эти часто возникающие и очевидные проблемы, легко представить себе, что существует множество других приложений для имитации пользовательского опыта навигации по веб-страницам, включая создание аннотированного кода.

Упрощение контента

Упрощение контента может упростить, реструктурировать и представить контент таким образом, чтобы лучше удовлетворять потребности людей с когнитивными нарушениями и проблемами обучения. Существуют инструменты, которые уже делают это, например, IBM Content Clarifier, который может взять любой фрагмент контента и упростить его, но есть еще кое-что, что можно сделать.

Джаред Смит предполагает, что этот тип преобразования контента может быть предложен так же, как и языковой перевод. «Не могли бы вы взять тот же контент и перевести его с упрощенного английского языка на совсем не английский язык, а полностью графически? Не могли бы вы разбить этот контент на более мелкие, более удобоваримые части, которые человек с нарушением обучаемости мог бы затем использовать в качестве контента небольшими, небольшими порциями, которые им нужны? Это довольно интересно ".

Эверетт Цуфельт развивает эту идею и ее полезность, говоря о ценности такого инструмента и его способности распространяться и на других пользователей. «Машинное обучение может синтезировать весь документ за вас до его основных моментов, - отмечает он, - что, кстати, хорошо не только для людей с ограниченными возможностями - это хорошо для многих людей, которые могут захотеть прочитать сводку из пяти предложений. статьи из 1200 слов ».

Применимость этой технологии обширна и, как всегда, подчеркивает, как более доступный веб-интерфейс для некоторых пользователей лучше веб-интерфейса для всех пользователей. При использовании в сочетании с другими инструментами упрощение контента можно сочетать с упрощенной навигацией и включать в любое количество сценариев, в которых пользователь выбирает читать сводный текст вперед или вместо любого фрагмента контента.

Возможности для новых инструментов

Индикация высокого уровня

Сегодня инструменты тестирования доступности могут использовать основанные на правилах методы, чтобы указать на определенные проблемы WCAG (например, есть ли у изображения атрибут alt или нет?). Но эти инструменты могут обнаруживать только 25% от общего числа ошибок; остальные 75% требуют ручного тестирования. Инструмент на основе машинного обучения будет вести себя по-другому, показывая вероятности классов ошибок на основе шаблонов, которые он обнаруживает в коде, в идеале увеличивая процент, охватываемый автоматизацией.

Эксперт по веб-доступности часто может предсказать наличие проблем, которые могут показаться не связанными с проблемой во время тестирования. Например, определенный тип проблемы в структуре заголовка - например, страница, на которой нет заголовка первого уровня - предполагает, что могут присутствовать другие структурные проблемы заголовка.

Без обширного тестирования мы не узнаем, насколько эффективным может быть инструмент тестирования, обученный с использованием машинного обучения, но мы можем с уверенностью предположить, что он будет использовать интуитивную эвристику, которую используют сегодня эксперты.

Сина Бахрам рассказал об эксперименте, который он провел в этой области:

Один из проектов, который мы реализовали 8+ лет назад в NC State, заключался в создании классификатора, чтобы попытаться научить его, учитывая произвольную веб-страницу, как классифицировать ее как имеющую проблемы с доступностью или нет. Что было интересно, так это то, что он, казалось, действительно указывал и быстро тяготел к некоторым очень общим функциям, которые были разделены между страницами, которые указывали на другие проблемы доступности, присутствующие на странице.

Если набор данных будет расширяться в геометрической прогрессии, эти классы проблем могут стать более детализированными. Был бы полезен даже инструмент, который предлагает вероятность некоторых необнаруживаемых ошибок.

Конечно, поскольку методы машинного обучения могут выявить неясные взаимосвязи, которые могут показаться не интуитивно понятными для людей, но, тем не менее, ценными, инструмент тестирования доступности с искусственным интеллектом может начать обнаруживать закономерности, которые автоматизированные инструменты и даже люди не могут. Эти шаблоны могут дать информацию об уровне и нюансах прогнозирования проблем, которые человек не может достичь.

Приложения для рабочих процессов Maker и Expert

Для чего нужен такой инструмент? Бахрам считает, что как часть непрерывной интеграции или определенного потока Git этот инструмент может быть невероятно ценным.

А в рамках существующих инструментов тестирования машинное обучение может укрепить уверенность и определенность, когда дело доходит до обнаружения и классификации проблем. Как указывает Эверетт Цуфельт, инструмент, который формулирует вероятность проблемы и уверенность в ее классификации, поможет направить и ускорить экспертную оценку и исправление.

«Сегодня в наборах правил нельзя сказать:« Я совершенно уверен, что ваше мегаменю недоступно ». Вы должны знать, чтобы искать это сами », - отмечает он. «Он не будет подниматься в оценщике WAVE, он не будет говорить:« Я думаю, у вас есть карусель, которая вращается на главной странице, и есть большая уверенность, что она не проходит WCAG по этим трем конкретным причинам ».

Но если бы это было возможно?

«Это добавляет большую ценность, потому что теперь это становится образовательным инструментом, а не просто контрольным списком неправильных вещей», - добавляет Цуфельт.

Приложения для не создателей и экспертов

Индикатор высокого уровня также принесет пользу рабочим процессам, не связанным с производителями и экспертами. Карл Гроувс считает, что такой инструмент может предупреждать конечных пользователей о потенциальных проблемах на веб-сайте. Как расширение браузера, инструмент может отображать предупреждение: «Похоже, на веб-сайте такого типа возникают проблемы с формами». Если его можно настроить в соответствии с потребностями конкретного пользователя, ценность этого типа механизма будет значительной.

Владельцы проектов или руководители, которые стимулируют принятие технических решений в организациях, также выиграют.

«Мы можем использовать его как инструмент для выбора технологий», - говорит Гровс. «В федеральном правительстве США люди платят большие деньги за коммерческие, готовые к употреблению продукты. Представьте, что их решение находится между двумя CMS, и этот гипотетический инструмент показал, что одна из них создает веб-сайты, с которыми связаны определенные шаблоны риска доступности. Затем они могут решить принять эти риски или избежать их ». Принятие обоснованных решений может сэкономить бесчисленное количество долларов и сэкономить головную боль как поставщикам, так и конечным пользователям.

Далее Гроувс превозносит еще одну потенциальную выгоду: «Я думаю, что одной из целей, даже если это второстепенная, будет стимулирование инноваций. Если вы раскроете проблемы компании, они захотят решить свои проблемы. Но если это неизвестно, то для них это не проблема ».

(Обратите внимание, что Google и другие поисковые системы уже имеют тенденцию оценивать более доступные страницы выше. Более доступный веб-сайт легче для машины для поиска и понимания, что еще больше усиливает коммерческую ценность доступности и инклюзивного дизайна.)

Очевидно, такой высокоуровневый индикатор обещает привести к появлению множества полезных приложений, которые могут снизить накладные расходы и способствовать принятию более эффективных решений.

Исправление в реальном времени

Если вы исследуете современный веб-сайт с правильной семантической разметкой, у него обычно есть заголовок. В заголовке вы, скорее всего, найдете основную навигацию и дополнительную навигацию. На сайте будет основной регион, который соответствует тегу ‹main›, если люди выполнили свою работу правильно. Будет нижний колонтитул. Есть ‹article›, ‹aside›, все семантические области HTML 5, а также различные связанные элементы и ориентиры в этих регионах.

И при этом есть две проблемы, с которыми часто сталкиваются пользователи программ чтения с экрана:

На веб-сайтах, где отсутствует хорошая структура кода, пользователю программы чтения с экрана трудно ориентироваться в содержании сайта.
Элементы, сгруппированные вместе визуально, часто не помечаются как группа для пользователей программ чтения с экрана, что затрудняет понимание того, какой элемент к какой группе принадлежит.

Сина Бахрам предложил решить проблему плохой разметки, используя подходы на основе машинного обучения и сегментации для маркировки различных областей страницы. Помимо маркировки, система фактически извлекала бы контент и изменяла разметку таким образом, чтобы это было не только доступно, но и идеально подходило для пользователей программ чтения с экрана в дополнение к другим типам пользователей (например, пользователям с ослабленным зрением):

Мы могли бы взять веб-страницу, нажать кнопку и заставить ее выглядеть так, как если бы разработчик имел в виду другую разметку. Особенно, если мы ослабляем ограничение: нам все равно, влияют ли мы на внешний вид страницы, потому что мы делаем это для пользователя программы чтения с экрана. Машинное обучение может быть задействовано несколькими способами. Первый - путем определения этих разных регионов. Номер 2, определяя модификации, которые можно было бы сделать, чтобы воспользоваться преимуществами некоторых улучшений, которые нужны пользователю, например, взяв текст и удвоив его размер. И затем номер 3, представляя общую иерархию доступным для пользователя способом.

Важно отметить, что такой инструмент не может волшебным образом решить все проблемы с доступностью в Интернете. Правильным решением по-прежнему является создание правильной семантической разметки в первую очередь, и создатели должны продолжать создавать надлежащие, доступные веб-сайты. Но решение, подобное предложенному Бахрамом, предполагает, что мы можем предоставить людям с ограниченными возможностями инструменты, чтобы получить то, что им нужно, даже при отсутствии семантической разметки.

Эверетт Зуфельт указывает, что уже, если документ разработан семантически, браузеры, такие как Safari, перейдут в режим чтения и вырежут много лишней разметки. Но для пользователей было бы чрезвычайно полезно иметь возможность быстро и легко переходить к интересующему их содержанию на странице, независимо от ошибок или упущений веб-разработчика.

Бахрам и Зуфельт также говорили о преимуществах группировки данных. В сценарии, в котором информация представлена в виде списка, пользователю программы чтения с экрана будет сложно определить, какие повторяющиеся призывы к действию или интерактивные элементы применимы к каким элементам в списке, если разработчик не выполнил работу по созданию арии, описанной метка. Например, список статей с соответствующими ссылками на каждую статью может сильно дезориентировать. Подобных примеров бесчисленное множество.

Более того, в эпоху адаптивного дизайна разработчики часто моделируют таблицы, используя вложенные блоки div и span, чтобы обеспечить более элегантное преобразование в форму списка на мобильном устройстве. Но это означает, что, несмотря на то, как они выглядят на различных устройствах, у пользователей программ чтения с экрана больше нет семантики таблиц. Поскольку разработчик отказался от настоящей таблицы HTML, пользователи программ чтения с экрана могут потеряться в длинном списке деконтекстуализированных данных, в которых отсутствуют значимые связанные заголовки столбцов.

Если бы расширение браузера, основанное на искусственном интеллекте и обучении машинному обучению, сгруппировало эти элементы вместе и пометило их, это было бы чрезвычайно полезно для пользователей программ чтения с экрана. Эту концепцию можно также применить к вращающимся каруселям, где содержимое слайдов можно извлекать и складывать. Тогда у пользователей программ чтения с экрана потенциально будут различные варианты навигации по содержимому слайда, включая его полный пропуск.

Вообще говоря, если мы сможем реорганизовать страницы таким образом, чтобы было легко ориентироваться или было легче видеть, пользователи с различными способностями смогут легко перемещаться по веб-контенту независимо от того, насколько хорошо семантически структурирован документ. Но, что, возможно, более важно, этот тип исправления доступности в режиме реального времени для конкретного пользователя может полностью уравнять игровое поле в контексте вспомогательных технологий (AT).

В настоящее время многие пользователи полагаются на устаревшие вспомогательные технологии, несовместимые с новейшими достижениями в области специальных возможностей, включая элементы ARIA и HTML5. Это означает, что многие организации и компании, ориентированные на доступность, должны балансировать между передовой и обратной совместимостью, чтобы оставаться доступными. Такая обратная совместимость приводит к значительным затратам и для организаций без полномочий или бюджета, как правило, не имеет приоритета. В свою очередь, это ограничивает доступ к контенту, давая преимущества организациям с более глубокими карманами.

Но, возможно, более проблемная асимметрия (не говоря уже о соображениях сетевого нейтралитета) лежит на пользователях. Пользователи с устаревшими AT часто находятся в неблагоприятном социально-экономическом положении, а вспомогательные технологии могут быть дорогими.

В Онтарио, где находится штаб-квартира Myplanet, правительство каждые 5 лет субсидирует стоимость нового компьютера плюс AT для лиц с определенными ограничениями. Однако во многих других частях мира подобных программ не существует. Возможность упростить и заменить веб-разметку может разрушить барьеры, создаваемые устаревшими технологиями, сделать Интернет действительно более доступным и дать предприятиям возможность предоставлять высококачественные возможности для всех.

Заключение

Искусственный интеллект и достижения машинного обучения имеют огромный потенциал в области доступности. Конечно, предстоит еще много исследований, но возможности имеют большой потенциал и их необходимо изучить.

Успех некоторых решений, которые мы обсудили, будет зависеть от того, насколько в первую очередь будут устранены препятствия, связанные с получением пользовательских данных. Другие идеи, такие как интеграция существующих инструментов машинного обучения с оценщиками доступности, не полагаются на пользовательские данные и могут начаться сегодня.

Наши эксперты в нескольких моментах предположили, что наибольшей ценностью для сообщества будет создание новых инструментов, подобных этим, с открытым исходным кодом. При разработке таких инструментов, как расширения браузера для конечных пользователей с физическими и когнитивными нарушениями, понимание того, что большой процент из них находится в неблагоприятном социально-экономическом положении, означает, что в идеале конечный продукт или услуга будут бесплатными. Оплатить абонентскую услугу зачастую невозможно.

Обсуждаемые нами идеи и решения никогда не заменят потребности реальных людей в написании стандартов доступности, проведении ручного тестирования и обучении разработчиков и редакторов контента тому, как создавать доступный и семантический код. Доступность все больше становится частью языка веб-разработки, и это должно продолжаться. Но даже несовершенные решения, которые ускоряют наш переход к полностью доступной сети, стоят вложений. Преимущества очевидны для людей, выполняющих самые разные роли - от тех, кто занимается тестированием доступности, до разработчиков, менеджеров проектов и, в конечном итоге, конечных пользователей.

Дени Будро красиво резюмирует это:

Я с нетерпением жду того момента, когда эти алгоритмы будут достаточно хороши или обеспечат достаточно качественный результат, чтобы определение нашей работы перешло от предоставления информации алгоритмам к их обучению или коучингу, чтобы они делали эти вещи лучше. . И по мере того, как мы делаем это, поскольку алгоритмы улавливают то, что мы, люди, считаем качественной работой в этой конкретной области, контент становится более семантическим и доступным. И вдруг все это начинает приносить пользу людям с ограниченными возможностями.

Мы благодарим наших экспертов за их отличный вклад и надеемся на дальнейшее обсуждение и сотрудничество с сообществом. Будет интересно посмотреть, куда все это нас приведет.

Нажмите кнопку ниже, чтобы получить загружаемый PDF-файл:

Повышение доступности Интернета с помощью машинного обучения