13.12.2022, Андрей Сизов, г. Новосибирск Обзор универсальных оптимизаций нейросетей
Для решения задачи снижения потребления памяти и повышения скорости расчета моделей нейронных сетей без существенной потери точности используются различные методы оптимизации. В этом посте рассмотрю три, наиболее часто встречающихся метода, такие как дистилляция, квантизация и прунинг