Публикации по теме 'opening-black-box'


Открытие черного ящика - за гранью градиентного спуска
Введение в проксимальный вид градиентного спуска При обучении модели мы пытаемся минимизировать среднее значение функций потерь модели по обучающим выборкам: Для каждого i , f_i в приведенной выше сумме - это потери, понесенные обучающей выборкой iᵗʰ как функция вектора параметров модели w . Для задачи минимизации потерь мы используем варианты метода стохастического градиента: на шаге k мы случайным образом выбираем функцию f из { f_1 , …, f_n }, и вычислим:..