Kolmogorov Arnold Networks as an alternative to multilayered perceptrons in tabular DL

18 May 2025, 15:42
12m
Клуб Выпусников

Клуб Выпусников

ТЦ Дирижабль, ул. Первомайская 3а
Машинное обучение и нейросети 18-Машинное обучение и нейросети

Speaker

Данил Руденко

Description

Несмотря на значительные успехи глубокого обучения в обработке изображений и текстов, его применение к табличным данным традиционно сталкивалось с существенными ограничениями. Ансамблевые методы, такие как XGBoost и CatBoost, долгое время демонстрировали превосходство над нейронными сетями в задачах обработки табличных данных, сочетающих категориальные, числовые и бинарные признаки. Однако в последние годы достижения в области Tabular Deep Learning позволили моделям на основе многослойных перцептронов (MLP) превзойти традиционные подходы.

В данной работе мы исследуем перспективы применения новой архитектуры - сетей Колмогорова-Арнольда (KANs), основанной на фундаментальной теореме о представлении многомерных функций в виде суперпозиции одномерных. В отличие от классических MLP, использующих фиксированные активационные функции, KANs заменяют линейные преобразования на параметризованные сплайнами обучаемые одномерные функции, что потенциально обеспечивает: (1) более точную аппроксимацию сложных зависимостей, (2) повышенную адаптивность к особенностям данных, и (3) улучшенную обобщающую способность модели.

Primary authors

Presentation materials