Сделайте сеть автономным продуктом

С 2018 года «автономные вещи» входят в список 10 лучших стратегических технологических тенденций Gartner. Автономные вещи, в том числе дроны, роботы, корабли и бытовая техника, используют ИИ для выполнения задач, обычно выполняемых людьми.

Здесь мы исследуем подмножество «автономных вещей», сосредоточив внимание на программных системах и особенно на возможности самооптимизации.

Для непрерывной оптимизации программного продукта традиционно существует два подхода:

Подход с закрытым исходным кодом: компания постоянно использует свои инженерные ресурсы для улучшения своего продукта.
Подход с открытым исходным кодом: усилия сообщества по улучшению продукта.

Теперь с ML (машинным обучением) появился третий подход: автономный подход. При таком подходе компания или сообщество разработчиков ПО с открытым исходным кодом изначально создает продукт; постоянное улучшение осуществляется за счет автоматического извлечения информации, скрытой при накоплении данных об использовании. Больше данных обеспечивает лучшую оптимизацию.

Эйдан Каннифф, генеральный директор Optic, дает определение автономного продукта в своем блоге Автономные продукты:

Автономный продукт – это продукт, который улучшается сам по себе, без активного ручного участия инженеров. Инженеры всегда могут написать первоначальный код и нажать «Выполнить», но эти продукты будут совершенствоваться гораздо эффективнее, чем любая команда людей.

Автономный подход интересен в двух аспектах:

Потенциальный огромный прирост производительности с этим новым подходом. Если вы инвестируете x ресурсов в улучшение своего продукта, прирост производительности будет линейным x с подходом с закрытым исходным кодом. С подходом с открытым исходным кодом вы можете получить 10x. Однако при автономном подходе это может быть экспоненциальное значение exp(x), поскольку продукт улучшается автоматически с минимальным участием человека.
Продукты могут оптимизировать себя до уровня, которого не может достичь ни одна человеческая команда.

Звучит как волшебство, но если вы посмотрите вокруг, то увидите, что многие автономные продукты уже существуют.

Примеры автономных продуктов

Одним из крайних примеров автономного продукта является AlphaGo Zero, компьютерная программа, разработанная Google DeepMind для освоения игр в го. Обучение игре начинается с tabula rasa (чистого листа), в случае го — случайным образом размещать фигуру. А затем играйте сами, чтобы получить больше данных для автоматической оптимизации своей стратегии посредством обучения с подкреплением. Следующая диаграмма является результатом. После 40 дней обучения AlphaGo Zero становится лучшим игроком в го в мире. Позже Google опубликовала AlphaZero, которая представляет собой обобщенную версию AlphaGo Zero, которая может учиться посредством самостоятельной игры и быть лучшим в мире в шахматах и сёги без вмешательства человека. Чем больше AlphaZero, тем лучше становится. На данный момент наивысший рейтинг Эло для человека, играющего в го, составляет 3765. Системе требуется менее 2 дней самообучения, чтобы стать лучше, чем любой профессиональный игрок в го.

Еще одним примером автономного продукта является Поиск Google; Первоначальный алгоритм PageRank, разработанный Брином и Пейджем, использовал толпу для обучения своих моделей. Каждый раз, когда кто-то ссылался на другую страницу или нажимал ссылку в Google, поиск Google становился умнее. В настоящее время поиск Google становится еще более изощренным в определении рейтинга страницы с агрегированием сотен «Сигналов». RankBrain — это алгоритм на основе ML/AI, который генерирует сигналы на основе исторических данных.

Автономная база данных Oracle — еще один пример автономного продукта. Это облачная база данных, которая использует машинное обучение для устранения человеческого труда, связанного с настройкой базы данных, безопасностью, резервным копированием, обновлениями и другими рутинными задачами управления, традиционно выполняемыми администраторами баз данных (DBA).

Два общих подхода для большинства поставщиков РСУБД для решения проблемы настройки базы данных:

Оптимизация внутренних компонентов базы данных с помощью правил или эвристик, чтобы она просто работала быстрее и требовала меньшей настройки. Такие методы, как столбчатые структуры в памяти, помогли в этом отношении, но не полностью решили проблему.
Внешнее программное обеспечение анализирует структуру базы данных и предоставляет рекомендации по настройке. Этот подход почти всегда основан на известных проблемах и шаблонах проблем, а программное обеспечение, как правило, управляется статическим набором правил. Кроме того, даже реляционные СУБД, называемые автономными, обычно требуют от администратора баз данных фактического выполнения действия по настройке, поскольку обычно требуется мера человеческого суждения. Этот подход имеет очевидные ограничения. Согласно отчету IDC (International Data Corporation) за 2018 год Автономная база данных Oracle: автоматизация на основе ИИ для управления базами данных и операций:

Корректировок, основанных на правилах и шаблонах, недостаточно, и вмешательство человека, необходимое для применения такого обслуживания, сделало бы эту услугу слишком дорогой, чтобы представлять собой значительное улучшение по сравнению с преобладающей моделью «сделай сам».

Oracle Autonomous Database использует другой подход. Он использует машинное обучение вместо кодированных правил и эвристик, которые оказались более продуктивными, охватывали более сложные сценарии и давали более оптимизированные результаты настройки. Что еще более важно, система становится все умнее и умнее, с большим количеством доступных данных.

Может ли сеть быть автономным продуктом?

Должны ли мы создавать будущее сетевое программное обеспечение как автономные продукты? В конце концов, многие проблемы оптимизации существуют во всех аспектах области проблем эксплуатации и технического обслуживания сети, начиная с дня -1, дня 0, дня 1 и дня 2. Уровень оптимизации оказывает значительное влияние на капитальные и эксплуатационные расходы, а также на способность предоставлять новые инновационные услуги. быстро. Самооптимизация не только очень желательна, но и является одним из важнейших требований концепции автономной сети вождения. Так что ответ однозначно ДА.

Мы знакомы с концепцией самоорганизующихся сетей (SON), которая была добавлена поверх системы LTE как набор функций для решения вариантов использования для достижения функций самонастройки, самооптимизации, самовосстановления и самозащиты. . Варианты использования и сопутствующие функции SON постепенно улучшались и добавлялись как часть стандарта.

Функция «самооптимизации» в SON здесь напрямую связана с концепцией «Автономный продукт». В мобильной сети он включает в себя такие функции, как:

CCO (оптимизация покрытия и пропускной способности) — адаптация параметров передачи (например, TxPower, наклона антенны и/или азимута) для преодоления пробелов в покрытии, улучшения общего уровня и качества сигнала.
MLB (балансировка нагрузки мобильности) — регулирует параметры передачи обслуживания и повторного выбора соты, чтобы сбалансировать нагрузку трафика между сотами (включая параметры многоуровневой связи, нескольких RAT и нескольких несущих).
MRO (Mobility Robustness Optimization) — регулирует параметры хендовера и повторного выбора соты, чтобы свести к минимуму частоту сбоев хендовера и частоту пинг-понга.
SON для ICIC и eICIC (координация межсотовых помех) — координация использования спектра сотовых кластеров для минимизации помех во временном и частотном измерениях, включая макро-сценарии и сценарии HetNet.
ESM (Energy Saving Management) — механизмы отключения сот в периоды низкого трафика и настройки параметров передачи соседних сот для обеспечения покрытия в зонах, где соты были отключены.
Оптимизация RACH — настройка параметров RACH для повышения вероятности доступа и уменьшения задержек доступа в разных ячейках (особенно существенна на границах областей слежения).
SON для AAS (адаптивные антенные системы) — разделение/объединение ячеек для достижения баланса между повышением пропускной способности и помехами.

SON обеспечивает автоматизацию сетевых операций. Но они не обязательно будут квалифицироваться как автономный продукт, если эти функции достигаются посредством явного кодирования на основе правил или эвристики.

Алгоритмы оптимизации сети SON должны быть заменены алгоритмом на основе ML, чтобы стать автономным продуктом.

Ниже приведен один пример LTE CCO (оптимизация покрытия и пропускной способности) с использованием алгоритма Fuzzy Q-Learning. Q-Learning (QL) — это особый тип обучения с подкреплением (RL), который может решать проблемы оптимизации, когда модель системы недоступна в виде выражения в закрытой форме. Следующие диаграммы демонстрируют хорошие результаты алгоритмов самооптимизации на основе машинного обучения.

Подобные примеры мы можем найти и в SOON (самоорганизующаяся оптическая сеть).

На приведенной ниже диаграмме показано, что модель машинного обучения предвидит приливную волну трафика, упреждающе переносит трафик, чтобы снизить вероятность блокировки сети. Стратегия миграции на основе машинного обучения превосходит простую стратегию эвристического алгоритма «Сначала кратчайший путь» и «Сначала с низкой нагрузкой».

2. На приведенной ниже диаграмме показано прогнозирование аварийного сигнала IN-PWR-LOW на основе машинного обучения. Чем больше обучающих данных, тем лучше результаты прогнозирования.

3. На приведенной ниже диаграмме показаны результаты оптимизации маршрутизации и назначения длины волны. Алгоритм на основе машинного обучения обеспечивает более оптимизированные результаты, чем простой эвристический алгоритм кратчайшего первого соответствия, когда доступно достаточное количество наборов данных для обучения модели машинного обучения.

Наряду с очевидными преимуществами создания продукта как автономного продукта существуют проблемы и риски. Иногда стоимость преодоления препятствий и снижения рисков слишком высока для реализации в качестве автономного продукта, поэтому требуется тщательный анализ.

Проблемы и риски создания автономного продукта

Существуют многочисленные препятствия для превращения сети в автономный продукт, вот некоторые из них:

Отсутствие вычислительной мощности

Машинное обучение требует большой вычислительной мощности. Обычно модель машинного обучения разрабатывается и обучается в автономном режиме в облаке, где доступны обильные вычислительные ресурсы. Затем обученная модель будет использоваться во время выполнения в продукте. Для тех моделей, которые требуют обновления модели почти в реальном времени, требуется специальная архитектура. Для сетевых продуктов необходима хорошо спроектированная сетевая инфраструктура автономного вождения, чтобы иметь возможность удовлетворить требования при разработке модели ML для уровня сетевого элемента (NE), сетевого уровня и облачного уровня.

Неоптимальный результат из-за неадекватных наборов данных

Для обучения и проверки модели ML требуется большой набор данных для вывода приемлемого оптимизированного вывода. Очень сложно получить достаточно большой набор данных с достаточным разнообразием данных, поступающих от разных типов пользователей и вариантов использования, которые помогают расширить применимость алгоритмов. Процесс накопления данных может занять очень много времени.

Один из возможных подходов — использовать подход, основанный на правилах, или эвристический подход при сборе данных для непрерывного обучения моделей машинного обучения в фоновом режиме. Перейдите к подходу ML, когда выходные данные ML продемонстрировали, что они лучше, чем эвристика с высокой степенью достоверности.

Другим возможным решением является использование так называемого обучения Human-In-The-Loop (HITL). HITL использует как человеческий, так и машинный интеллект для создания моделей машинного обучения. Желательная система активного обучения может побуждать инструкторов ботов проверять выходные данные с низким показателем достоверности и проверять эти суждения, прежде чем возвращать их обратно в модель, чтобы сократить время на создание хорошей модели.

Выявленные уязвимости

Самообучение с помощью данных об использовании открывает дверь для внешней силы, влияющей на внутреннюю логику. Если не обращаться должным образом, это может привести к тяжелым последствиям.

Microsoft Tay Bot, чат-бот, созданный для того, чтобы пользователи Twitter могли обучать бота и позволять ему учиться самостоятельно, является полностью автономным продуктом. Но отключили его только через 16 часов после запуска. Потому что это было сделано пользователями со злым умыслом переобучить бота разжиганию ненависти и крайне правой пропаганде с помощью функции повторяй за мной. Позже Tay Bot заменяется на Zo Bot. Но через два года Zo Bot также закрыли из-за тех же проблем.

В своей статье, опубликованной в журнале Nature, Почему ИИ с глубоким обучением так легко обмануть, Дуглас Хэвен исследует уязвимости машинного обучения на основе DNN при распознавании изображений. Он цитирует открытие Дэна Хендрикса, доктора философии. студент факультета информатики Калифорнийского университета в Беркли.

Как и многие ученые, он пришел к выводу, что они являются самой яркой иллюстрацией того, что ГНС принципиально хрупки: они блестяще справляются со своими задачами до тех пор, пока, попадая на незнакомую территорию, не ломаются непредсказуемым образом.

Так что не забудьте оценить риски уязвимости данных при разработке автономного продукта и их последствия, если кто-то сможет обмануть систему. Потому что «ИИ с глубоким обучением: с большой силой приходит большая хрупкость» (Douglas Heaven, 2019).

Выводы

При переходе к сети автономного вождения (ADN) разработка и создание самооптимизирующихся сетевых функций крайне желательны и необходимы для работы в постоянно меняющихся сложных сетевых средах. Не только ради увеличения производительности, но и, что более важно, он может оптимизировать сеть до такой степени, которая никогда не была бы возможна при использовании традиционного подхода, основанного на правилах или эвристического подхода.

Алгоритмы на основе машинного обучения повышают уровень оптимизации с помощью данных. Участие человека в процессе заключается не в внесении изменений в код, а в постановке целей оптимизации, подготовке данных и оценке результатов.

При переходе на сеть автономного вождения (ADN) мы должны полностью осознавать трудности и новые уязвимости, которые она привнесла. Крайне важно продолжать разработку более продвинутого алгоритма машинного обучения и всегда размещать в системе набор ограждений для выявления потенциальных недостатков.

Готовы вы или нет, но к нам приходит все больше и больше автономных продуктов. Откуда я знаю? Так как

«Мир — это одна большая проблема данных». ~Эндрю Макафи.

Еще кое-что

Автономные продукты потенциально могут запускать новые бизнес-идеи только потому, что данные могут влиять на их результаты.

Например, консультант по поисковой оптимизации (SEO). Консультант по поисковой оптимизации является экспертом по поисковой оптимизации, и компании и владельцы сайтов платят ему за советы о том, как получить более высокий рейтинг, больше целевого трафика и, в конечном итоге, больше прибыли для своих веб-сайтов. Это работа, требующая знаний. Ниже представлена знаменитая Периодическая таблица SEO-факторов 2020 года. В ней описаны факторы, которые могут генерировать положительные или отрицательные «сигналы» для рейтинга страницы в поисковой системе Google.

Интересно, может ли когда-нибудь появиться консультант по оптимизации сетевых услуг (NSO), чья работа состоит в том, чтобы помочь своим клиентам получить высококачественный, но недорогой маршрут трафика с помощью игрового автономного продукта для оптимизации сетевого трафика.

Не уверен, но может быть.