Организациям необходимо понимать поведение пользователей, используя данные, чтобы улучшить свои позиции на рынке. Поэтому предприятия запрашивают отзывы пользователей различными способами. Например, у известной технологической компании Garmin есть специальная страница, на которой клиенты могут отправлять идеи и предложения. Точно так же Hotjar использует тестирование удобства использования, тогда как Zapier фокусируется на опросах отзывов пользователей.

Персонализация — еще один важный аспект, связанный с пользовательским интерфейсом. В современном цифровом присутствии очень важно привлекать потребителей и обеспечивать положительный опыт. Хорошим примером является Netflix, который высоко оценивает персонализацию просмотра. Привычки просмотра и выбор пользователя определяют его предпочтения в отношении жанровых предпочтений, чтобы сделать последующие предложения надлежащим образом.

Netflix использует персонализацию, чтобы помочь своим клиентам ориентироваться в обширной библиотеке фильмов и телесериалов. Он предоставляет компании доступ к пользовательской информации, создавая для пользователей проблемы конфиденциальности. Федеративное обучение полезно. Это может улучшить качество обслуживания клиентов за счет персонализации при сохранении конфиденциальности пользователей.

Источник: Бизнес Провод

Что такое федеративное обучение?

Федеративное обучение — это машинное обучение на устройстве, при котором модель обучается на устройствах конечных пользователей. Пользовательские данные не отправляются на сервер для обучения модели. Вместо этого обновленные параметры отправляются обратно на центральный сервер для агрегирования. Центральный сервер использует эти сводки для обновления глобальной модели и отправки этой глобальной модели обратно на пользовательские устройства в качестве обновления версии.

Федеративное обучение — это решение в современном мире, которое предлагает персонализированные онлайн-системы, обеспечивая при этом конфиденциальность данных конечных пользователей. Экономичная система также обеспечивает более быструю обработку информации, делая модель доступной по всему миру.

Типы федеративного обучения

Со временем федеративное обучение приняло различные формы и формы в компьютерном мире. Вариации зависят от:

  • Схемы
  • Разделы данных

Типы по схемам

Модель федеративного обучения Cross-Silo

Бункер в информационных технологиях — это отдельное место хранения данных для организации, которая не является частью остальной части сети. Он содержит неструктурированные необработанные данные с ограниченным доступом. В результате информация недоступна для использования или дальнейшей обработки во внешней сети.

Многочисленные хранилища, подключенные к центральному серверу, составляют федеративную архитектуру обучения, состоящую из нескольких блоков. Например, несколько организаций могут подключаться через единую сеть, сохраняя необработанные данные отдельно в своих хранилищах. Он обеспечивает крупномасштабную обработку данных в разных компаниях, обеспечивая при этом конфиденциальность.

Объяснение архитектуры и потока данных на примере

Архитектура включает конечных пользователей из разных компаний, бункер от каждой компании и центральный сервер.

Например, выше приведена схема многоуровневой системы, соединяющей общественную больницу, местную лабораторию и медицинский исследовательский центр. Каждая организация имеет дело с общим населением сообщества, предоставляя им аналогичное пространство выборки для работы.

Он позволяет общаться и создает общую базу данных для доступа. Данные каждой настройки подлежат алгоритму конфиденциальности перед сохранением в своем бункере. Затем на основе предварительно определенных параметров строится и обучается локальная модель машинного обучения перед передачей ее на центральный сервер.

Например, локальная модель машинного обучения в больницах обучается на информации о распространении заболеваний среди пациентов. Лаборатория также использует региональную модель, основанную на типах тестов, проводимых в лаборатории, и их частоте. В каждой из этих моделей используемые данные основаны на определенных параметрах для обеспечения конфиденциальности пациентов и безопасности данных.

Сервер получает 3 локальные модели машинного обучения из всех трех хранилищ для создания глобальной модели, доступной для всех объектов в сети. Например, предположим, что медицинский исследовательский центр должен изучить растущее вирусное заболевание в сообществе, являющемся частью межсистемной системы. В этом случае он может полагаться на глобальную модель для проверки распространения этого вирусного заболевания и того, какие тесты могут обнаружить его присутствие.

Затем глобальная модель постоянно пересматривается и обновляется в соответствии с изменениями в локальных моделях. Это итеративный процесс, который гарантирует, что каждое новое агрегирование улучшает обмен информацией в сети. В результате взаимодействие между больницей, лабораторией и медицинским исследовательским центром можно улучшить с помощью более универсальной модели машинного обучения.

Модель федеративного обучения между устройствами

Эта модель федеративного обучения работает с данными от отдельных устройств, работающих в сети. Несколько устройств конечного пользователя, таких как ноутбуки и мобильные телефоны, выступают в качестве источника данных для локального обучения модели. Затем центральный сервер объединяет их для создания глобальной модели.

Отличным примером может быть Google, использующий эту настройку для обучения модели прогнозирования следующего слова. Во-первых, он создает модель местного языка на основе ввода пользователя на этом устройстве, чтобы предсказать следующее слово. Это достигается за счет использования последовательных моделей, обученных федеративным способом, в котором они запоминают прошлые данные, введенные пользователем, чтобы делать прогнозы в будущем.

Каждое пользовательское устройство создает локально обученную модель на своих данных. Поскольку существует много устройств конечных пользователей, обучение модели с использованием таких обширных точек данных позволяет повысить точность прогноза. Например, модель RNN, протестированная на группе носителей английского языка из США, использовала для обучения около 7,5 миллиардов предложений. В результате точность предсказания увеличилась почти на 24%, что привело к увеличению количества кликов по генерируемой полосе предсказания примерно на 10%.

Затем каждое устройство вычисляет стохастический градиент последовательной модели, используя один или несколько шагов. Наконец, глобальная модель объединяет рассчитанные градиенты (параметры) каждого устройства с центральным сервером.

Источник: Блог КМУ МЛ

В результате система становится более эффективной, улучшая пользовательский опыт. В конце концов, кто не оценит правильно предсказанное следующее слово, когда он находится в процессе составления текста?

Типы на основе разделов данных

Прежде чем мы углубимся в эту модель категоризации, мы должны понять следующие термины, касающиеся федеративного обучения:

  • Пространство функций — определяет ключевые характеристики, используемые для категоризации доступного набора данных в системе.
  • Sample Space — состоит из устройств/хранилищ конечных пользователей, которые передают набор данных на центральный сервер.

Данные проектируются в трех структурных формах на основе этих двух архитектурных спецификаций, что приводит к различным типам федеративных систем. Давайте посмотрим на них.

Модель горизонтального федеративного обучения

Эта структурная форма имеет дело с общим пространством функций между различными клиентами в сети, в то время как выборка для каждого из них остается разной. Он также известен как федеративное обучение на основе образцов. В первую очередь это касается клиентов с однородным набором данных.

Источник: Федеративное машинное обучение: концепция и приложения

Модель горизонтального федеративного обучения позволяет создать многозадачную федеративную систему обучения.

MOCHA — многозадачная федеративная система обучения

Система состоит из нескольких клиентов в сети. Во-первых, локальная модель, состоящая из стандартных функций, обучается локально и передается центральному серверу, создавая глобальную модель.

MOCHA — это федеративная многозадачная обучающая среда для обучения модели посредством итеративного процесса. Он может справляться с расхождением данных, возникающим в неоднородном пространстве выборки. Эта многозадачная федеративная модель обучения обеспечивает низкие затраты на связь и обеспечивает отказоустойчивость сети.

Модель вертикального федеративного обучения

Вертикальная сеть имеет дело с разными функциями, но имеет общее пространство выборки. Его также называют федеративным обучением на основе признаков. В первую очередь эта концепция используется при взаимодействии B2B и обмене данными, когда несколько организаций, имеющих дело с одним и тем же набором потребителей, используют общую сеть.

Источник: arXiv тщеславие

Общая структура, используемая для вертикального федеративного обучения, называется PyVertical. Давайте подробнее рассмотрим соответствующие шаги.

PyVertical — платформа для модели вертикального федеративного обучения

Платформа использует двухэтапный процесс для обеспечения реализации вертикальной модели FL. Он обеспечивает конфиденциальность данных и эффективное обучение модели. Шаги состоят из:

  • PSI — Private Set Intersection: это криптографический метод, который позволяет нескольким сторонам с разными наборами данных вычислять пересечения. Это гарантирует, что необработанные данные каждой стороны являются конфиденциальными для обеспечения конфиденциальности данных. Кроме того, это позволяет сторонам найти общий для всех набор данных.
  • SplitNN — разделенные нейронные сети: это модель обучения, разделенная на разные сегменты, каждый из которых обрабатывается разными сторонами в сети. Он обрабатывает каждый набор данных как отдельную нейронную сеть, передаваемую в следующий сегмент в процессе обучения. Каждая сторона в сети обучает свой набор данных и отправляет его следующей. Это вовлекает больше участников в процесс обучения, что приводит к повышению эффективности вычислений.

Затем PyVertical обучает данные в три этапа: вертикальное разбиение, PSI и SplitNN.

Источник: OpenMined

  1. Данные разделены по вертикали на изображения и метки, которые в совокупности называются точками данных. Затем каждой точке данных присваивается уникальный идентификатор, и данные перемешиваются случайным образом.
  2. Теперь PSI помогает связывать разные наборы данных с помощью уникальных идентификаторов. Точки данных, образующие пересечение, отфильтровываются.
  3. Сеть разделена для обучения изображений и меток.

Это позволяет вертикальным федеративным моделям обучения эффективно работать с разнородными данными.

Модель федеративного трансферного обучения

Эта модель федеративного обучения объединяет как горизонтальные, так и вертикальные федеративные системы обучения. Это позволяет обмениваться информацией между доменами без многих стандартных функций или образцовых пространств. Кроме того, это позволяет различным объектам совместно использовать глобальную модель без совместного использования общего пространства функций, обеспечивая конфиденциальность своих данных.

Идея состоит в том, чтобы обучить модель на большом наборе данных для конкретной проблемы, а затем применить ее к другой проблеме в аналогичной области. Это делает модель зависимой от сходства предметной области различных задач.

Федеративное трансферное обучение (FTL) в автономном вождении

Автономное вождение использует обучение с подкреплением (RL), модель FTL, основанную на наборе сделанных наблюдений и предпринятых действий. Без какого-либо вмешательства со стороны человека-водителя успех этого приложения полностью зависит от практического обучения каждой модели.

Каждое автономное транспортное средство является независимым объектом в системе, не имеющим многих общих черт или пространств с другими автомобилями того же типа. Каждый автомобиль проходит свой процесс обучения с подкреплением, которым можно поделиться через онлайн-передачу информации.

Источник: FTL — концепция и приложения

Архитектура состоит из трех частей, каждая из которых обрабатывает отдельный канал связи в сети. То есть:

  • Обнаружение и сбор данных. Первым шагом в процессе обучения с подкреплением является сбор данных на основе наблюдений и действий автономного транспортного средства. Автомобиль воспринимает и собирает информацию, основанную на его взаимодействии с людьми, другими автомобилями и некоторыми другими переменными в его окружении. Данные используются для локального обучения модели для этого автомобиля.
  • Облако транспортных средств.Локальная модель, созданная с помощью RL, сохраняется в облаке для этого конкретного автомобиля. Облако необходимо для хранения локальной модели, поскольку ее необходимо многократно оптимизировать на основе наблюдений и действий транспортного средства с течением времени.
  • Интернет-облако.Автомобильное облако обеспечивает доступность локальной модели для центрального сервера, в данном случае интернет-облака. Центральный сервер регулярно получает локально созданные модели RL и усредняет их, используя метод объединенного усреднения.

Это позволяет создать глобальную модель, которая, в свою очередь, может помочь оптимизировать модели RL всех автономных транспортных средств, подключенных через интернет-облако.

Некоторые часто используемые стратегии FL

Система федеративного обучения включает в себя несколько клиентов, которые имеют огромное количество данных. Любая функция, имеющая дело с этой сетью, должна создавать локальные модели, которые можно объединить в общую глобальную модель для использования всей системой.

Ниже приведена базовая структура, которая может определять федеративную модель обучения.

где x — параметр модели, E — ожидание параметров модели на основе клиентских данных, а fi — функция потерь по сравнению с другими. параметры и данные клиента.

Как видите, функция потерь определяется для каждого клиента с использованием клиентских данных и конкретных параметров. После создания функции потерь ожидания в отношении клиентских данных реализуются в функции для извлечения только необходимой информации. Затем создается совокупность ожиданий от всех клиентов для определения параметров модели на глобальном уровне.

Для осуществления вышеуказанных процессов используются разные подходы. Вот некоторые примечательные из них:

SGD — стохастический градиентный спуск

Как видно из названия, это алгоритм, который перемещается по градиенту функции на каждой итерации. Основная цель — свести градиент к его минимальному значению.

При реализации SGD база данных клиента используется для вычисления одного стохастического градиента для отдельной функции потерь. Центральный сервер получает все эти градиенты от нескольких клиентов и усредняет их.

Он создает синхронную модель, поскольку каждый клиент переносит все данные в одну точку градиента перед их усреднением. Одним из недостатков SGD является медленная обработка данных.

FedAvg — объединенное усреднение

FedAvg — это более быстрый и лучший подход к реализации кросс-разрозненной модели. В отличие от SGD, это позволяет клиентам выполнять несколько шагов градиента, что приводит к более точному расчетному значению.

Следующее уравнение определяет каждый шаг, предпринятый для расчета SGD на стороне клиента. В FedAvg этот шаг повторяется несколько раз для каждого клиента в S.

Затем центральный сервер усредняет эти значения SGD.

Эти обновленные значения градиента от каждого клиента передаются центральному серверу, который объединяет их для создания глобальной модели. Это ускоряет процесс, поскольку некоторая часть оптимизации модели выполняется локально на стороне клиента.

Проблема в том, что централизованные обновления в такой модели невозможны. Кроме того, если данные от клиентов разнородны, то есть сильно различаются, модель может не сходиться.

SCAFFOLD — стохастическое контролируемое усреднение для федеративного обучения

Проблемы в FedAvg приводят к еще одному решению в виде SCAFFOLD. Как видно из названия, в этом методе расчеты более контролируемы. Он касается проблемы сходимости FedAvg для разнородных данных путем введения значения коррекции при каждом расчете градиента в итерациях, выполняемых локально.

Где c – ci – это корректирующий термин.

Затем результаты этих локальных итераций отправляются на центральный сервер для усреднения, аналогично другим методам. Хотя процесс выполняется быстрее благодаря локальной оптимизации вычислений градиента, поправочный член также гарантирует, что данные централизованы и легко сходятся.

Заключение

Федеративное обучение — это современное решение для персонализированных цифровых пространств для конечных пользователей. Благодаря быстрой обработке данных и эффективной конфиденциальности данных конечных пользователей, сегодня это потребность в цифровом пространстве. Это позволяет создавать цифровую сеть между несколькими клиентами без ущерба для конфиденциальности, обеспечивая безопасные и непредвзятые модели данных для совместной работы. Он также предлагает множество схем и разделов данных в моделях для удовлетворения разнообразных требований цифровых пространств.

В то время как взаимодействие между несколькими клиентами поддерживается за счет федеративного обучения между разрозненными хранилищами, модель с несколькими устройствами обеспечивает безопасный обмен данными между устройствами конечных пользователей. В дополнение к этому существуют три различные структурные модели, в зависимости от функций, определяющих набор данных и пространство выборки, которое он охватывает. К этим типам относятся: горизонтальная, вертикальная и переносная модели федеративного обучения.

Выбор модели обучения для любого клиента сильно зависит от типа обмена данными, требуемого организацией, и общего фактора между каждым набором данных в сети. Важно сделать правильный выбор, чтобы воспользоваться всеми преимуществами федеративного обучения, но первым шагом остается изучить и понять типы моделей федеративного обучения.

Автор:Худа Махмуд