Обновления концепции Distribution Shift, часть 2 (машинное обучение)

Уменьшение смещения распределения во время тестирования с гарантиями производительности (arXiv)

Автор: Жуй Дин, Цзэлун Ян, Фэн Цзи, Сюнху Чжун, Линбо Се.

Аннотация: Из-за неправильного выбора выборки и ограниченности обучающих данных между обучающим и тестовым наборами часто существует сдвиг распределения. Этот сдвиг может отрицательно повлиять на производительность тестов графовых нейронных сетей (GNN). Существующие подходы смягчают эту проблему, либо повышая устойчивость GNN к сдвигу распределения, либо уменьшая сам сдвиг. Однако оба подхода требуют переобучения модели, что становится невозможным, когда структура и параметры модели недоступны. Чтобы решить эту проблему, мы предлагаем FR-GNN, общую структуру GNN для проведения реконструкции признаков. FRGNN конструирует отношения отображения между выходными и входными данными хорошо обученной GNN для получения вложений, представляющих классы, а затем использует эти вложения для восстановления характеристик помеченных узлов. Эти реконструированные функции затем включаются в механизм передачи сообщений GNN, чтобы влиять на прогнозы немаркированных узлов во время тестирования. Примечательно, что функции реконструированного узла можно напрямую использовать для тестирования хорошо обученной модели, что эффективно уменьшает сдвиг распределения и приводит к повышению производительности тестирования. Это замечательное достижение достигается без каких-либо изменений структуры или параметров модели. Мы предоставляем теоретические гарантии эффективности нашей системы. Кроме того, мы проводим комплексные эксперименты с различными общедоступными наборами данных. Результаты экспериментов демонстрируют превосходную производительность FRGNN по сравнению с основными методами.

2. Решение проблемы сдвига распределения на рынках RTB с помощью экспоненциального наклона (arXiv)

Автор: Минджи Ким, Сон Джин Ли, Бумсик Ким.

Аннотация: Сдвиг распределения в моделях машинного обучения может быть основной причиной снижения производительности. В данной статье рассматриваются характеристики этих изменений, вызванных, в первую очередь, рыночными моделями ставок в реальном времени (RTB). Мы подчеркиваем проблемы, создаваемые классовым дисбалансом и предвзятостью выборки, которые являются мощными причинами сдвигов в распределении. В этой статье представлен алгоритм экспоненциального выравнивания повторного взвешивания наклона (ExTRA), предложенный Марти и др. (2023), чтобы учесть изменения в распределении данных. Метод ExTRA предназначен для определения весов важности исходных данных с целью минимизировать расхождение KL между взвешенными исходными и целевыми наборами данных. Заметным преимуществом этого метода является его способность работать с использованием размеченных исходных данных и неразмеченных целевых данных. С помощью смоделированных реальных данных мы исследуем природу сдвига распределения и оцениваем применимость предлагаемой модели.

Обновления концепции Distribution Shift, часть 2 (машинное обучение)

Вопросы по теме