
Инновационный практикум – обязательный предмет в 6 семестре у студентов ФПМИ, направленный на помощь студентам с профессиональной профориентационной подготовкой и разделенный на несколько треков по выбору в зависимости от интересов студентов.
Научный трек предназначен для студентов, планирующих дальнейшую работу в сфере научных исследований по тематике математики или Computer Science, выполнения фундаментальных и прикладных НИР и НИОКР в лабораториях и научных институтах.
Итоговая отчетность по предмету для студентов трека происходит в формате отчётной мини-конференции, на которой студенты рассказывают о результатах работы за семестр.
Конференция проходит очно в МФТИ (Долгопрудный) на зачетной неделе в МФТИ в мае.
Рассматривается эффективность и оптимизация извлечения характеристик из символьной музыки с помощью библиотеки jSymolic2. Построены классовые диаграммы кода и проведены замеры производительности программы до и после оптимизаций
Вертикальное федеративное обучение (VFL) - одно из активно развивающихся направлений распределенного машинного обучения. Несмотря на то, что в ходе VFL стороны не делятся локальными данными напрямую, утечка данных возможна при передаче промежуточных результатов. В данной работе рассматривается проблема приватности в распределенных моделях компьютерного зрения. На примере ResNet изучена эффективность атаки Kmeans и защиты от нее при помощи регуляризации. Рассматриваются различные распределенные архитектуры ResNet, в т.ч. различные распределения слоев исходной модели между участниками VFL и различные виды постобработки. В ходе исследования получен алгоритм защиты, позволяющий увеличить метрики приватности до 20%.
В данной работе исследуется проблема декодирования сигналов головного мозга в аудиосигналы с использованием физически-информированных методов получения эмбеддингов сигналов. Предлагается решить задачу классификации стимулов по соответствующим сегментам аудиоданных. Для данного ЭЭГ-сигнала под стимулом понимается аудиосигнал, который вызвал мозговую активность. В качестве критерия качества для выбора оптимальной модели используется средняя долей правильных ответов. В исследовании были рассмотрены механизмы внимания и методы получения скрытых представлений, которые учитывают физические принципы, с целью улучшения качества обработки аудиосигналов и повышения точности их декодирования. Полученные результаты имеют важное значение для развития интерфейсов мозг-компьютер и понимания принципов обработки аудиосигналов человеческим мозгом.
В предтавленном исследовании обсуждается поиск универсального триггера для нейронных сетей (рассмотрена модель GPT-2). Добавление триггера способствует непредсказуемому поведению модели, в частности - генерация нецензурного текста. Триггер можно применить к родственным моделям.
Исследуется проблема восстановления зависимости между показаниями датчиков фМРТ и восприятием внешнего мира человеком. Проводится анализ зависимости между последовательностью снимков фМРТ и звуковым рядом. Требуется предложить метод прогнозирования показаний фМРТ по прослушиваемому звуковому ряду. При прогнозировании сложноорганизованных временных рядов, зависящих от экзогенных факторов и имеющих множественную периодичность, связи между рядами устанавливаются тестом Гренджера.
In this work we study upper bounds for optimal convergence rates in stochastic optimization with smooth strongly convex objective function and zero-order unbiased oracle with bounded markovian noise. We adapt randomized accelerated GD to zero-order one-point oracle and provide argument and function convergence rates matching best known non-markovian ones.
В данной статье рассматривается задача оптимизации стохастических вариационных неравенств. Мы предлагаем стохастический вариант универсального проксимального зеркального метода для решения задачи оптимизации. Получены оценки необходимого числа итераций для достижения заданного качества решения вариационного неравенства. Также, мы сравниваем полученный алгоритм с другими популярными оптимизаторами на задаче классификации по картинкам.
In this work we study lower bounds for optimal convergence rates in stochastic
optimization with smooth strongly convex objective function and first-order markovian oracle. In these settings we provided lower bounds matching previously known
upper bounds for a wide family of target functionals. Optimal rates remain unknown
only for the special case of small noise.
Название работы - корректность алгоритма разбора LC(k)-грамматик.
В данной работе представлен алгоритм разбора LC-грамматик, являющийся усовершенствованием алгоритма разбора LL-грамматик. Было проведено доказательство корректности алгоритма разбора LC(1)-грамматик.
Абстракт научной работы.
В научной работе рассматривается отрицательный параметр рациональности в равновесии квантового отклика. Будут представлены различные формулы, графики и рассуждения. Цель - изучить отрицательный параметр рациональности в равновесии квантового отклика и на основе исследований сделать выводы о его возможности быть меньше нуля.
Исследуются величины $m(n, k_{-1}, k_0, k_1, t)$ максимально возможного размера множества векторов с фиксированным количеством координат $-1, 0, 1$, обладающего тем свойством, что никакие два вектора не имеют скалярное произведение $t$. Подробно рассматривается случай, когда $k_{-1} \sim k_{-1}'n, k_{0} \sim k_{0}'n, k_{1} \sim k_{1}'n, t \sim t'n$ при $n \to \infty$, а $k_{-1}', k_0', k_1', t' \in (0, 1)$ --- фиксированные константы. В работе приводятся новые нижние оценки $m(n, k_{-1}, k_0, k_1, t)$.
В данной работе рассматривается задача распределенной стохастической выпуклой оптимизации в контексте режима перепараметризации относительно целевой функции потерь в условиях прерывистой коммуникации. В алгоритмах используются M параллельных машин, каждая из которых на протяжении R раундов коммуникации обращается K раз к стохастическому оракулу. Мы предоставляем обновленную версию минимаксных оценок задачи распределенных вычислений, используя ограничения перепараметризации.
A finite family $\mathcal{F}$ of convex sets is called satisfying $(p,q)$-property or just a $(p,q)$-family if among any $p$ members of this family there are $q$ of them having a point in common. It is known that if $p \leq q \leq d+1$ then there is a constant $HD_d(p,q)$ such that for any $(p,q)$-family $\mathcal{F}$ of convex sets in $\mathbb{R}^d$ there is a set of $HD_d(p,q)$ points that intersects every member of $\mathcal{F}$. The goal of our work is finding new upper bound on $HD_2(4,3)$. During the presentation it will be told about current progress on initial problem and our results related to properties of $(4,3)$-families of convex sets on a plane.
В работе описаны основные подходы к решению задач оптимизации "черного ящика". Рассмотрен алгоритм Zero-Order Accelerated Stochastic Gradient Descent, оценки на его сходимость и максимально допустимый шум в концепции оракула со стохастическим врождебным шумом. Получены оценки и сформулирована теорема о сходимости в концепции оракула с детерминированным шумом.
Данная работа посвящена оценке качества работы алгоритмов сопоставления разномодальных изображений, полученных в результате виртуальной развёртки документов. При этом искажения исходного документа могут быть нелинейными, поэтому в ходе работы был написан код для построения соотвествия между изображениями на основании эталонных точек, проставленных вручную. Далее он использовался при анализе результатов работы различных детекторов и дескрипторов особых точек. Был произведен подбор их гиперпараметров для максимизации качества, и затем выявлены наиболее и наименее удачные пары детектор+дескриптор на основе различных показателей.
В работе рассматривается проблема добавления поддержки языковых средств в ARINC 653 совместимые операционные системы реального времени. Предлагается метод добавления поддержки компилируемого языка программирования в ARINC 653 совместимую ОСРВ.
В работе решается задача гибкого планирования в облачном производстве с учетом затрат на логистику. Для этого разрабатывается модель обучения с подкреплением на основе алгоритма Q-lerning. Результат работы алгоритма сравнивается с точным решением, жадным решением и решением на основе GNN. Дополнительно исследуется вероятностное пространство возможных решений.
В работе рассмотрены задачаопределения площади диабетического макулярного отека (ДМО) на снимках оптической когерентной томографии (ОКТ). Предложен новый метод сегментации ДМО, основанный на бинаризации изображения по его частотному представлению. Представлена реализация программного решения для сегментации и подсчёта площади ДМО. Приведены примеры работыалгоритма на нескольких ОКТ-снимках.Полученные результаты, в сравнении с результатами работы стандартной реализации алгоритма активного контура,свидетельствуют о превосходстве предложенного решения.
Aggregating forecasts from multiple experts is a valuable method to improve prediction accuracy. Our work examines the influence of hyperparameters on the accuracy of the aggregation algorithm for a countable number of experts. We implement a time series generator with specified properties and an aggregating forecasting model. We conduct a series of experiments with various hyperparameters of the algorithm. The experiments confirm that these hyperparameters have a significant influence on the algorithm's performance.
Topic modeling is very useful for analyzing text data. It can be used to analyze large collection of text data such as articles, reviews, social media, and others. This helps in clusterization documents by topic, extracting keywords, and identifying patterns in the data. There are a lot of automatically calculated criteria of informativeness of thematic models. One of these criteria is coherence. But the problem with coherence is that it does not take into account most of the text in the calculation, which makes evaluating the quality of the topic by this critera unreliable. The aim is to propose a new method for calculating coherence that takes into account the distribution of the topic throughout the text.
В задачах обработки сигналов входные данные представляют собой временные ряды. В данной работе рассматривается метод, основанный на непрерывном тензорном представлении временных рядов, в приложении к задаче классификации электроэнцефалограмм (ЭЭГ) и аппроксимации исходного сигнала. Применение методов, основанных на нейронных дифференциальных уравнениях, позволяет работать с временными рядами как с непрерывными по времени, а разложение сигнала на частотные составляющие позволяет работать с ним как с трёхмерным линейным объектом. Основной результат работы~--– построение модели, работающей с непрерывным по времени тензорным представлением сигнала и анализ эффективности данного метода в сравнении с современными методами обработки сигнала, использующими его дискретное представление и непрерывное представление без тензоризации.
Данная работа посвящена оценке качества работы методов выделения и сопоставления особых точек на 3D-изображениях медицинского формата NIFTI. В ходе работы был написан код для генерации и визуализации из исходных 3Д-файлов данных, соответствующих различным аффинным преобразованиям. На этих данных было протестировано качество сопоставления алгоритма SIFT-3D в условиях различных сдвигов по осям и вращений на малые углы вокруг одной из осей, был написан код, позволяющий высчитывать ошибку сопоставления особых точек на изображениях. Были построены графики, с их помощью сделан вывод о целесообразности использования алгоритма SIFT-3D для данной задачи.
Технология eBPF - активно развиваемая часть операционной системы ядра Linux, позволяющая вставлять и запускать заверенный верификатором пользовательский код в модулях ядра. Однако, как и с большим количеством другого системного ПО, эта подсистема не относится к доверенной кодовой базе Linux и в ней регулярно находятся уязвимости и ошибки. Эта работа посвящена изучению возможности применения property-based подхода в тестировании eBPF. Была построена модель подмножества eBPF на языке программирования Idris2, с помощью которой построен генератор случайных eBPF программ и проведено соответствующее тестирование официальной реализации eBPF.
В данной работе изучаются коды разреженной регрес-
сии (SPARC, Sparse Regression Codes) в применении к передаче по
каналу с шумом и сжатию с потерями. Метод достигает оценок Шен-
нона для пропускной способности канала с шумом и функции rate-
distortion в сжатии с потерями, что подтверждает необходимость его
изучения. Проведено сравнение двух методов кодирования для сжа-
тия с потерями - Successive Approximation и AMP.
Данная статья предлагает развить математический аппарат, на котором строится модель Neural SDE. В ней рассмотрено, как вычисление фазовых траекторий стохастических дифференциальных уравнений обеспечивает качественный прогноз аномалий во временном ряду. Таким образом, это предоставит как возможность эффективнее бороться с шумами, так и, в частности, полезный инструмент для упреждения появления так называемых черных лебедей - резких перемен поведения временных рядов, как случайных процессов. Подобного рода аномалии способны нарушить корректную работу Neural SDE в виду высокой корреляции элементов анализируемой выборки между собой.
Данное исследование оценивает вычислительную эффективность алгоритмов прямой свертки в нейронных сетях на центральных процессорах архитектуры ARM. Был проведен сравнительный анализ различных реализаций алгоритмов прямой свертки, оценивая их время работы. Результаты демонстрируют важность выбора оптимального алгоритма для эффективного выполнения нейросетевых вычислений на устройствах с архитектурой ARM.
Абстракт
Симплекс-метод является основным низкоуровневым алгоритмом, используемым в методах типа ветвей и границ для решения сложных промышленных проблем оптимизации, формализуемых в виде целочисленных линейных программ. Несмотря на то, что теория симплекс-метода была разработана ещё десятилетия тому назад, его практическая реализация сталкивается с рядом проблем, в основном численного характера. Из-за технического характера этих проблем отражение подходов к их решению не носит систематический характер. В рамках работы был проведен сравнительный анализ 5 солверов: HIGHS, GLPK, Lpsolve, COINOR, ZIMPL. На их примере рассмотрены способы решения проблем, возникающих в симплекс-методе.
Симплекс-метод является основным низкоуровневым алгоритмом, используемым в методах типа ветвей и границ для решения сложных промышленных проблем оптимизации, формализуемых в виде целочисленных линейных программ. Несмотря на то, что теория симплекс-метода была разработана ещё десятилетия тому назад, его практическая реализация сталкивается с рядом проблем, в основном численного характера. Из-за технического характера этих проблем отражение подходов к их решению не носит систематический характер. В рамках работы был проведен сравнительный анализ пяти решателей: HIGHS, GLPK, Lpsolve, COINOR, ZIMPL. На их примере рассмотрены способы решения проблем, возникающих в симплекс-методе.
Большие модели преобразования текста в изображение совершили значительный скачок в области искусственного интеллекта, обеспечив высококачественный и разнообразный синтез изображений из заданного текстового описания. Однако, когда возникает запрос на генерацию специфичного объекта, в нашем случае человека, модель не может сгенерировать его с необходимой точностью и передать его идентичность. Предлагается решение, которое будет способно генерировать изображения заданного человека в различных вариациях в высоком разрешении. В данной работе рассматриваются методы DreamBooth, IP-Adapter, а также предлагаются наши собственные методы. Они представляют собой различные модификации IP-Adapter'a и позволяют принимать на вход сразу несколько изображений, что улучшает качество генерации. Все методы сравниваются между собой.
Модели преобразования текста в изображение совершили значительный скачок в области искусственного интеллекта, обеспечив высококачественный и разнообразный синтез изображений из заданного текстового описания. Однако, когда возникает запрос на генерацию специфичного объекта, в нашем случае человека, модель не может сгенерировать его с необходимой точностью и передать его идентичность. Предлагается решение, которое будет способно генерировать изображения заданного человека в различных вариациях в высоком разрешении. В данной работе рассмотрены методы DreamBooth, IP-Adapter, а также предложен собственный метод. Он представляет собой модификацию IP-Adapter'a и позволяет принимать на вход сразу несколько изображений, что улучшает качество генерации.
Одной из важных задач вычислительной фотографии является
задача спектральной реконструкции. Это задача восстановления
гиперспектральных изображений из трехканальных. Гиперспек-
тральные изображения, в отличие от трехканальных изображений,
дают больше информации о характеристиках поверхности изобра-
жения, что дает множество полезных приложений. Но прямой ме-
тод съемки гиперспектральных изображений бывает слишком до-
рогим/долгим/неудобным. В данной работе предлагается несколь-
ко новых быстрых и точных методов для задачи восстановления
спектров.
Автоматизированные транспортные системы, включая беспилотные автомобили, становятся все более актуальными в современном мире, представляя собой перспективное направление развития транспортной отрасли. Для обеспечения безопасности и эффективности таких систем необходимо развивать и совершенствовать модели 3D детекции на лидарных облаках точек. В данной научной статье мы рассматриваем современные модели 3D детекции, сосредотачиваясь на модели VoxelNeXt, и исследуем их практическое применение в контексте построения беспилотного автомобиля.
This research addresses the well-known Max Cut problem, which has various applications both in machine learning and theoretical physics. The Max Cut problem is computationally NP-hard over general graphs. This research presents a novel empirical approach aimed at enhancing the quality of Max-Cut approximations within polynomial time bounds. While the problem is tractable for graphs with small tree-width, its solution over general graphs often relies on Semi-Definite Programming or Lovász-Schrijver relaxations. We achieve the described improvement of approximation quality by combining relaxation approaches and tree-width driven k-diagonal ideas
This article discusses the well-studied Max-Cut problem in graph theory, which has found applications in various fields, particularly Machine Learning, Theoretical physics (the Ising model), and VLSI design.
The original problem is NP-complete, and we call an effective solution such a polynomial algorithm that gives the answer closest to the true one.
For a long time, the best accuracy achievable by polynomial algorithms was at least half of the optimal cut. It was only in 1995 that Goemans and Williamson introduced a polynomial algorithm using semidefinite programming and randomized rounding, guaranteeing an approximation of $\approx 0.878$. This is the best possible approximation guarantee for the Max-Cut problem under the Unique games conjecture \cite{unique}.
In this article, we propose a novel approach to solving the Max-Cut problem with improved accuracy, in the particular case where the graph exhibits a treewidth bounded by a pre-fixed value, providing a number of heuristics.
Distributed optimization algorithms have emerged as a superior approaches for solving machine learning problems. To accommodate the diverse ways in which data can be stored across devices, these methods must be adaptable to a wide range of situations. As a result, two orthogonal regimes of distributed algorithms are distinguished: horizontal and vertical. During parallel training, communication between nodes can become a critical bottleneck, particularly for high-dimensional and over-parameterized models. Therefore, it is crucial to enhance current methods with strategies that minimize the amount of data transmitted during trainng while still achieving a model of similar quality. This paper introduces a new accelerated algorithm, working in the regime of vertical data division. By utilizing a momentum and variance reduction technique from the L-Katyusha algorithm and Gossip procedure for communications, we provide one of the first theoretical convergence guarantees for the vertical regime.
Distributed optimization algorithms have emerged as a superior approaches for solving machine learning problems. To accommodate the diverse ways in which data can be stored across devices, these methods must be adaptable to a wide range of situations. As a result, two orthogonal regimes of distributed algorithms are distinguished: horizontal and vertical. During parallel training, communication between nodes can become a critical bottleneck, particularly for high-dimensional and over-parameterized models. Therefore, it is crucial to enhance current methods with strategies that minimize the amount of data transmitted during trainng while still achieving a model of similar quality. This paper introduces a new accelerated algorithm, working in the regime of vertical data division. By utilizing a momentum and variance reduction technique from the Loopless-Katyusha algorithm and Gossip procedure for communications, we provide one of the first theoretical convergence guarantees for the vertical regime.
Актуальность способностей ИИ в области анализа котировок нельзя переоценить.
В сфере финансовых рынков рассматривается задание нейронной сети, дающей
анализ временных рядов и стратегии по заполнению экономического портфеля.
В данной статье рассматривается задача оптимизации стохастических вариационных неравенств. Мы предлагаем стохастический вариант универсального проксимального зеркального метода для решения задачи оптимизации. Получены оценки необходимого числа итераций для достижения заданного качества решения вариационного неравенства. Изучен стохастический вариант и идея добавления рестартов.
В данной работе исследуется задача сегментации изображений по текстовому запросу для интеллектуальных роботов и беспилотного транспорта. Основная идея - использование двухстадийного алгоритма, включающего в себя модель детекции и сегментации. Показано, что с увеличением сложности запросов снижается точность работы inference моделей и были предложены пути решения данной задачи. Были рассмотрены специфические проблемы, которые возникают при работе с outdoor датасетами.
We give a way of equipping the derivation algebra of a group algebra with the structure of a graded algebra. A non-trivial graduation is obtained for all groups that are not perfect. Moreover, a graded derivation algebra can be equipped with the structure of dg-algebra.
Абстракт: В данной работе рассмотрены две теоремы о пенни-графах. Первая теорема устанавливает верхнюю границу числа рёбер в пенни-графах, а вторая теорема говорит о существовании определенного вида пенни-графов и оценивает их количество рёбер. Так-же представлены полученные результаты нашей работы: это нижняя оценка отношения числа рёбер к числу вершин для определенного класса графов.
Я исследую задачу о сходимости безградиентного метода оптимизации в задаче минимума-максимума выпукло-вогнутой функции. Предполагается, что у нас есть оракул, возвращающий неточное значение функции с шумом. Моей задачей является улучшение критерия сходимости, полученного ранее при решении данной проблемы.
Ключевые слова: Стохастичексая оптимизация, безградиентные методы, негладкие методы оптимизации, задачи минимума-максимума
Прибыль является одним из ключевых показателей эффективности деятельности компании и каждой компании необходимо распределять ресурсы таким образом, чтобы получить максимально возможную прибыль. Задача максимизации прибыли обычно представляет собой динамическую оптимизацию. В данной работе рассматривается две формулировки данной задачи: с расширением производства и с венчурным капиталом и способы оптимизации каждой из них с помощью аналитических методов и численных.
Теория детских рисунков -- крайне важный раздел математики в связи с обратной задачей Галуа, ядром теории является эквивалентность комбинаторно-топологической категории детских рисунков $\mathcal{DESS}$ и арифметико-геометрической категории пар Белого $\mathcal{BELP}(\overline{\mathbb{Q}})$. В классической теории совсем не уделено внимание исследованию структур на этих категориях. В докладе будет рассказано о квантовых детских рисунках, обнаруженном автором новом аспекте теории. Квантовые деформации классических категорий оказываются абелевыми, с помощью такого подхода можно увидеть неожиданные структуры на классических категориях. Будет предложено новое исследовательское направление, связанное с поиском гомологических и гомотопических инвариантов детских рисунков.
В докладе обсуждается вариация на классические задачи о разбиении фигуры на две конгруэнтные части. Рассматривается гипотеза, что при разбиении выпуклой центрально-симметричной фигуры на две конгруэнтные части центр симметрии всегда лежит на общей границе двух частей. Доказан частный случай для простых, но не обязательно выпуклых фигур на плоскости при условии, что фигура разбита на две части несамопересекающейся кривой. Имеются продвижения по классификации типов движений в общем случае на плоскости.
Этот доклад будет посвящен методам, которые были использованы, и продвижениям, которые были получены во время попыток построить отображение из классических узлов и зацеплений в плоско-виртуальные. Работа основана на статье В.О. Мантурова и И.М. Никонова, посвященной отображению узлов в утолщенном цилиндре в плоско-виртуальные узлы.
Построены инварианты классических узлов с помощью отображения в плоско-виртуальные диаграммы с тремя типами перекрёстков. К сожалению, из использованного подхода и плоско-виртуального аналога полинома Джонса не удалось получить инвариант более сильный, чем сам полином Джонса.
В работе рассматривается представление группы крашеных кос $PB_n$. Оно строится как композиция нескольких гомоморфизмов, зависящих от выбора начальной нити и степени для гомоморфизма $z \rightarrow z^d$. Показано, что для кос на трех нитях представление неточное, а также дана некоторая оценка на условие, при котором представление может быть точным.
В этой работе рассматриваются гипотезы связанные с «Мастер-теоремой» из статьи Фомина-Пылянского. Мы пытаемся доказать единственность минимального элемента для совокупностей кривых с тремя «почти» движениями Редемейстера. А так же единственность изменений некоторого «разбиения» четырехугольников(которые строятся по точкам в проективной плоскости) относительно изотопности кос(которые являются их траекториями).