Conveners
Оптимизация и машинное обучение
- Kirill Ivanov (Moscow Institute of Physics & Technology (MIPT))
Методы DL (глубокое обучение) исторически не выигрывали у классических ML-моделей на задачах с табличными данными, состоящими из категориальных, бинарных и числовых признаков. Более того, модели основанные на градиентном бустинге решающих деревьев (как СatBoost, XGBoost) зачастую значительно выигрывали нейросети. Однако современные модели, основанные на полносвязных сетях (MLP) начали...
Предлагается метод цифровой генерации редких специфических гистологических окрасок (Masson’s Trichrome, PAS, Ki-67 и др.) на основе стандартных гематоксилин-эозиновых (H&E) изображений с использованием генеративно-состязательных сетей (GAN). Показана возможность преодоления проблемы отсутствия точного пространственного соответствия между парами изображений при помощи архитектуры CycleGAN....
В этом отчете будет представлено исследование влияния техники рестартов на оптимизацию обучения сверхпараметризованных моделей. Исследуется теоретическая связь между обобщенной (L_0, L_1)-гладкостью функций потерь и явлением двойного спуска, характерным для сверхпараметризованных моделей. Основная гипотеза исследования состоит в том, что рестарты в градиентных методах могут выполнять роль...
Crucial for large-scale models, federated learning faces two major challenges: privacy preservation and high communication costs. While SignSGD addresses the communication issue by transmitting only gradient signs, its only earlier proposed private version lacks proper privacy guarantees and convergence analysis. We construct a new variant of DP-SignSGD that combines Gaussian noise with...
Оптимизация транспортных сетей – это задача, направленная на эффективное управление потоками (грузов, данных и т.д.) с целью минимизации издержек, времени или загруженности сети, либо максимизации её пропускной способности. В данной работе исследуются различные модификации алгоритма Гарга-Кённемана, для решения данных задач, и анализируется его связь с методами онлайн-оптимизации. В частности,...
Данная работа является частью большой статьи Д.А. Пасечнюка, в которой теоретическая верхняя граница максимально допустимого уровня аддитивного шума (MALN) в выпуклой, непрерывной по Липшицу оптимизации нулевого порядка используется, чтобы установить соответствующие верхние границы для классов сильно выпуклых и гладких задач. В этой работе неконструктивно была получена граница для гладкого...