Почему это имеет значение ?
Размер модели является ключевым показателем для оптимизации, например:
- Дизайн системы обучения: выбор конкретного оптимизатора sgd, пропускной способности сети, оборудования (памяти и обработки).
- Дизайн системы логического вывода: оптимизация хранилища файлов модели, квантование, разделение модели для обслуживания.
Как мы это измеряем?
- При описании размера модели (в единицах памяти, таких как ГБ) мы также должны указать более подробную информацию о том, где он был измерен. Различные вкусы размера модели:
- Размер обучающей модели: это объем памяти, необходимый для хранения всех параметров модели и параметров оптимизатора. Это может быть значительно больше, чем размер модели вывода, в зависимости от выбора оптимизатора. (может быть где угодно от 1.x до 2x).
- Размер файла модели: размер файла модели после обучения, экспортируемого в постоянное хранилище.
- Размер файла вывода. Модель можно обрабатывать различными способами (разделять, квантовать) перед ее оптимизацией для вывода. Размер файла логического вывода должен быть указан вместе с соответствующей обработкой.
- Использование памяти: размер файла модели включает накладные расходы на сериализацию параметров (поплавки/intX). Во время обслуживания использование памяти может быть меньше или больше. Это то, что важно с точки зрения оптимизации производительности.
Выводы:
- Всегда сообщайте об использовании служебной памяти при сообщении об использовании памяти.
- При составлении отчета о размере модели всегда указывайте этап жизненного цикла (обучение/вывод/хранение) и задействованную обработку.