Speaker
Description
Несмотря на значительные успехи глубокого обучения в обработке изображений и текстов, его применение к табличным данным традиционно сталкивалось с существенными ограничениями. Ансамблевые методы, такие как XGBoost и CatBoost, долгое время демонстрировали превосходство над нейронными сетями в задачах обработки табличных данных, сочетающих категориальные, числовые и бинарные признаки. Однако в последние годы достижения в области Tabular Deep Learning позволили моделям на основе многослойных перцептронов (MLP) превзойти традиционные подходы.
В данной работе мы исследуем перспективы применения новой архитектуры - сетей Колмогорова-Арнольда (KANs), основанной на фундаментальной теореме о представлении многомерных функций в виде суперпозиции одномерных. В отличие от классических MLP, использующих фиксированные активационные функции, KANs заменяют линейные преобразования на параметризованные сплайнами обучаемые одномерные функции, что потенциально обеспечивает: (1) более точную аппроксимацию сложных зависимостей, (2) повышенную адаптивность к особенностям данных, и (3) улучшенную обобщающую способность модели.