Мы взаимодействуем с компьютерами уже несколько десятилетий, и до недавнего времени мало что было сделано для улучшения интерфейса. Если мы немного подумаем об этом, мы увидим, что люди все время использовали компьютеры для выполнения больших вычислений, автоматизации рутинных задач, хранения и извлечения корпоративных данных. Текстовый интерфейс, существовавший на ранних стадиях, прекрасно служил этим целям. Первоначальные формы связи, которые существовали, всегда были нацелены на замену их физических аналогов: электронная почта заменила почту, а Интернет заменил библиотеки для обмена статической информацией.

С появлением социальных сетей и революции смартфонов все очень сильно изменилось. Люди начали использовать вычислительные устройства, чтобы делиться любимой информацией с теми, кто им небезразличен. Внедрение популярных механизмов голосования, таких как кнопка «Нравится», дало компьютерам возможность лучше понять наши интересы. Предыдущие механизмы обратной связи, такие как система комментариев, затрудняют точное понимание компьютером наших интересов, поскольку даже самые лучшие системы обработки естественного языка подвержены ошибкам. Механизмы голосования передают этому компьютеру информацию о том, нравится нам что-то или нет, со 100-процентной достоверностью.

Механизм голосования хорош, но все еще имеет фундаментальный разрыв между взаимодействием человека и компьютера. Нам по-прежнему нужно физически вводить данные, чтобы компьютер понял, что нам нравится конкретная вещь, которой поделились. Представьте, что наш друг показывает нам что-то, что его интересует, он сможет мгновенно сказать нам, нравится ли нам то, что он показывает, прежде чем мы скажем ему: «Эй, мне нравится эта вещь». Он также мог бы сказать, были ли мы ужасно взволнованы, увидев это, или нам это понравилось в более обычном смысле. Компьютер не может понять, насколько мне что-то нравится. Компьютер понимает сходство как дискретную функцию, а на самом деле оно имеет тенденцию быть непрерывной функцией.

Предлагаемое решение предполагает непрерывную оценку данных микрофона и веб-камеры. Голосовой анализ и анализ изображений, скорее всего, обеспечат предполагаемый уровень сходства на непрерывной шкале. Если вы действительно взволнованы, ваши глаза, как правило, расширяются (хотя анализ изображения касается всего анализа лица), и вы можете звучать немного громко, смеяться немного дольше или громко плакать (обнаружение смеха/обнаружение возбуждения — да). , вы можете называть вещи сумасшедшими :D ). Я знаю, что говорю о вещах, которые довольно сложно реализовать, но если бы это можно было реализовать при поддержке таких компаний, как Facebook или Flipboard, вы легко получили бы замечательный набор данных для обучения. Если у вас есть приложение с достаточными правами пользователя для доступа к веб-камере и голосу, вы получите ввод, обработаете его с помощью своего алгоритма обучения, предскажете, нравится ли что-то пользователю, и если пользователю нравится текущий пост, у вас будет мгновенная обратная связь для Ваш алгоритм обучения. Помимо предсказания того, нравится ли пользователю вещь, сходство может быть определено на основе того, где текущее выражение пользователя находится между его минимальным и максимальным отклонениями от нормального выражения.

Как всегда, ваша функция правдоподобия, как и другие статистические модели, подвержена некоторой ошибке, даже если вы предоставляете лучшие обучающие наборы. А на уровне инфраструктуры ваш центр обработки данных получит удар, когда вы попытаетесь проанализировать видеоданные сотен миллионов пользователей в режиме реального времени. Конечно, с такими технологиями также будет много проблем с конфиденциальностью, но будем надеяться, что наступит день, когда можно будет доверять нашим машинам и поставщикам технологий.

То, что существует сегодня, вчера было всего лишь концепцией.

ПРИМЕЧАНИЕ. Нижеприведенный блог является репостом из моего предыдущего блога, так как я хочу писать дальше на Medium. Пост изначально был написан в 2014 году, с тех пор AI и ML значительно изменились. Системы голосового взаимодействия, такие как Alexa, Google Assistant и Cortona, стали возможными благодаря искусственному интеллекту и машинному обучению. Они представляют собой замечательные системы взаимодействия прогресса.