Приводит ли обучение с учетом квантования Tensorflows к фактическому ускорению во время обучения?

мы изучаем возможность использования обучения с учетом квантования для исследовательского проекта, чтобы определить влияние квантования во время обучения на скорость сходимости и время выполнения. Однако мы еще не полностью уверены в том, что это правильный инструмент. Не могли бы вы прояснить следующие моменты: 1) Если слой квантуется во время обучения с учетом квантования, это означает, что входные данные и веса квантуются, а все операции, включая функцию активации, квантуются, а затем, перед возвратом, выходы деквантовываются с точностью совместим со следующим слоем. Это понимание правильное? 2) Совместимость профилировщика Tensorboard? 3) Приводит ли обучение с учетом квантования, в принципе, к ускорению во время обучения в вашем общем опыте, или это невозможно из-за того, что оно является исключительно симуляцией? 4) Не могли бы вы указать нам на ресурс о том, как добавить пользовательские квантователи и типы данных в tensorflow s.t. они совместимы с GPU?

Большое спасибо за Вашу помощь!


person Lorenz Kummer    schedule 19.06.2020    source источник


Ответы (1)


После проведения некоторого исследования QAT не ускоряет обучение, а только подготавливает модель для посттренировочного квантования. Однако MuPPET - это алгоритм, который фактически ускоряет обучение за счет квантования.

person Lorenz Kummer    schedule 31.07.2020