Исследователи из Сбербанка, МФТИ и Университета Иннополис разработали инновационный алгоритм для итеративной оптимизации, способный ускорить точную настройку гиперпараметров в системах искусственного интеллекта. Это значительное улучшение поможет снизить количество необходимых шагов для оптимизации работы этих ИИ-моделей.
Данный метод также позволяет оптимизировать процессы, состоящие из двух этапов, где на первом этапе осуществляется обучение нейронной сети для извлечения числовых представлений данных. Эти представления обеспечивают максимальную точность на втором этапе классификации. Кроме того, этот подход может успешно применяться в некоторых случаях дообучения крупных языковых моделей.
Авторы алгоритма отмечают, что исследователи часто встречаются с подобными задачами в процессе разработки и дообучения систем искусственного интеллекта. Существующие методы математической оптимизации не всегда эффективны, что и побудило ученых разработать более универсальный и быстрый подход.
Этот новый метод позволяет более точно подстраивать модели машинного обучения за меньшее количество шагов и эффективно справляется с ситуациями, где расчет может сопровождаться случайными ошибками. По качеству работы он значительно превосходит уже существующие аналоги.
Источник: @vremyavperedrus