Политика искусственного интеллекта YouTube

Если кто-то загружает видео с крайним насилием и кровопролитием - скажем, о людях, у которых изо рта идет пена от отравления, или об отце, убаюкивающем умирающего младенца, - должен ли ИИ YouTube пометить и удалить его со своего сайта? Очевидный ответ: да.

А может и нет.

Шкала цензуры YouTube

Ежедневно на YouTube ежеминутно загружается около 300 часов видео. Невообразимый масштаб содержания сайта означает, что одни только люди не могут должным образом подвергать цензуре все жестокие, явные или иным образом нежелательные материалы, которые могут быть отправлены для публикации.

К счастью, Google (материнская компания YouTube) разработала алгоритмы, в которых используются передовые методы машинного обучения, чтобы отсеивать вредоносный контент до того, как будет нанесен какой-либо ущерб. Например, только за первый квартал 2019 года с сайта было заблокировано чуть более восьми миллионов видео. Из этих восьми миллионов более шести миллионов были идентифицированы и удалены с помощью искусственного интеллекта YouTube, 70 процентов из них - до записи одного просмотра. Когда дело доходит до содержания насильственного экстремизма, цифры даже лучше. Уже в 2017 году ИИ YouTube смог поймать 98 процентов террористических видео, загруженных на сайт.

Такие числа представляют собой ошеломляющий успех, учитывая, что технология распознавания изображений сегодня все еще является растущей, не полностью разработанной областью, и учитывая огромную широту материала, который эти алгоритмы должны преодолеть. Но скорость, с которой искусственный интеллект YouTube удаляет плохие материалы, говорит вам только отчасти. Для всех опасных видео, снятых в офлайн-режиме, также есть много ложных срабатываний.

Чувствительность

Допустим, вы полицейский в торговом центре, и несколько тысяч человек проходят через двери вашего торгового центра каждый день. Насколько тщательно вы будете проверять тех людей, которые приходят и уходят? Сколько вы остановите и проверите в целях безопасности? Наверное, не так много из-за характера того, что охраняется.

Но что, если вы агент TSA?

Природа того, что защищается, обязывает вас быть более осторожными при проверке. Агенты TSA постоянно проверяют пассажиров авиакомпаний на наличие даже малейших подозрений, потому что риск пропустить угрозу слишком велик.

Мы можем назвать разницу между работой полицейского в торговом центре и агентом TSA чувствительностью.

Оказывается, чувствительность важна не только для программного обеспечения, ориентированного на безопасность, но и для профессионалов, ориентированных на безопасность. Например, в сфере кибербезопасности вредоносные программы часто маскируются под обычные данные, чтобы попытаться проникнуть на уязвимый компьютер незамеченным. Поэтому программы безопасности должны быть чувствительны ко всему, что даже выглядит как вирус. Возможно, для персонального компьютера фильтр пропустит еще немного. Но как насчет высокочувствительной правительственной компьютерной сети? В этом случае программа должна быть настроена так, чтобы быть очень чувствительной - чтобы насторожиться при любом предупреждении, даже если это приведет к множеству ложных срабатываний.

Ульрих Кайзер - учитель теории музыки из Германии. В прошлом году после того, как одно из его обучающих видео было отключено системой Content ID YouTube, которая регистрирует работы, защищенные авторскими правами, и проверяет, не копируются ли они и не используются в других местах на платформе. Он задавался вопросом, почему на сайте запрещена абсолютно легальная музыка, и начал эксперимент. Он открыл новую учетную запись на YouTube и начал старательно публиковать музыку, являющуюся общественным достоянием, написанную давно умершими композиторами. Почти неизбежно каждый раз его видео отмечалось как нарушение авторских прав и блокировалось с сайта.

Почему видео снимали так предсказуемо? По той же причине агенты TSA тщательно проверяют пассажиров авиакомпаний. Мередит Роуз, эксперт по авторскому праву Public Knowledge, сказала Vice Motherboard: Алгоритмическое сопоставление всегда будет неточным, а компании по закону поощряются к чрезмерному включению в свою фильтрацию. Поскольку алгоритмы несовершенны, а международные законы разнообразны и сложны, YouTube поощряется к чрезмерной цензуре контента на своем сайте и допускает, что в процессе будет создано определенное количество ложных срабатываний. Учителя музыки могут быть справедливо недовольны, но альтернатива - недооценка - была бы намного хуже.

Последствия правильного поступка

Объем контента, который необходимо обрабатывать каждый день, в сочетании с последствиями публикации опасных материалов, означает, что надзиратели YouTube, по понятным причинам, повернули ручку своих алгоритмов цензуры на высокий уровень.

К сожалению, ИИ уничтожает не только старую классическую музыку. В феврале этого года несколько каналов, связанных с Pokemon Go и Club Penguin, были помечены за показ запрещенного контента сексуального характера. Оказывается, искусственный интеллект YouTube уловил использование аббревиатуры CP, которую он интерпретировал как ссылку на детскую порнографию (в Pokemon Go CP означает Combat Power, а в Club Penguin CP просто означает название игры). Всего несколько недель назад тот же ИИ начал отмечать видео с боевыми роботами (нишевый вид спорта), интерпретируя видео как демонстрацию жестокого обращения с животными.

Всякий раз, когда возникают эти ложные срабатывания, они вызывают некоторый переполох, с ними разбираются, и искусственный интеллект Google становится лучше для этого. Кратковременное прерывание боя роботов - небольшая плата за то, чтобы уберечь платформу от агрессивных и экстремальных материалов.

Но не всегда все так просто. Иногда насилие и крайности пересекаются с законным и важным. Я спросил вас в начале этой статьи: должен ли искусственный интеллект YouTube запрещать видео людей, даже младенцев, отравленных и умирающих? Ответ, очевидно, был да.

Когда журналисты и правозащитники на местах во время гражданской войны в Сирии попытались задокументировать зверства, которые правительство Башара Асада совершает в отношении своего народа, они обратились за помощью к YouTube. Они начали снимать на видео происходящие зверства, чтобы показать миру, насколько плохи дела. В видеороликах было показано ужасающее насилие: людей отравляют, умирают люди, умирают даже дети и младенцы. А потом более ста тысяч из этих видео были удалены алгоритмами цензуры YouTube.

YouTube - это огромная платформа, обладающая огромной силой влиять на позитивные изменения в мире и огромной ответственностью защищать обычных людей от вреда. Искусственный интеллект, лежащий в основе всего этого, замечателен - почти невероятно эффективен - а также несовершенен, со склонностью к смешным и вредным оплошностям. Хорошо то, что с каждым годом ситуация становится лучше.