Размер модели

Почему это имеет значение ?

Размер модели является ключевым показателем для оптимизации, например:

Дизайн системы обучения: выбор конкретного оптимизатора sgd, пропускной способности сети, оборудования (памяти и обработки).
Дизайн системы логического вывода: оптимизация хранилища файлов модели, квантование, разделение модели для обслуживания.

Как мы это измеряем?

При описании размера модели (в единицах памяти, таких как ГБ) мы также должны указать более подробную информацию о том, где он был измерен. Различные вкусы размера модели:
Размер обучающей модели: это объем памяти, необходимый для хранения всех параметров модели и параметров оптимизатора. Это может быть значительно больше, чем размер модели вывода, в зависимости от выбора оптимизатора. (может быть где угодно от 1.x до 2x).
Размер файла модели: размер файла модели после обучения, экспортируемого в постоянное хранилище.
Размер файла вывода. Модель можно обрабатывать различными способами (разделять, квантовать) перед ее оптимизацией для вывода. Размер файла логического вывода должен быть указан вместе с соответствующей обработкой.
Использование памяти: размер файла модели включает накладные расходы на сериализацию параметров (поплавки/intX). Во время обслуживания использование памяти может быть меньше или больше. Это то, что важно с точки зрения оптимизации производительности.

Выводы:

Всегда сообщайте об использовании служебной памяти при сообщении об использовании памяти.
При составлении отчета о размере модели всегда указывайте этап жизненного цикла (обучение/вывод/хранение) и задействованную обработку.

Размер модели

Почему это имеет значение ?

Как мы это измеряем?

Выводы:

Вопросы по теме