
Инновационный практикум – обязательный предмет в 6 семестре у студентов ФПМИ, направленный на помощь студентам с профессиональной профориентационной подготовкой и разделенный на несколько треков по выбору в зависимости от интересов студентов.
Научный трек предназначен для студентов, планирующих дальнейшую работу в сфере научных исследований по тематике математики или Computer Science, выполнения фундаментальных и прикладных НИР и НИОКР в лабораториях и научных институтах.
Итоговая отчетность по предмету для студентов трека происходит в формате отчётной мини-конференции, на которой студенты рассказывают о результатах работы за семестр.
Конференция проходит очно в МФТИ (Долгопрудный) на зачетной неделе в МФТИ 19 и 23 мая. Планируется также онлайн-трансляция, ссылка появится немного позднее.
Интересно изучение свойства гибкости для алгебраических многообразий, и, в частности, для поверхностей дель Пеццо. Для поверхностей дель Пеццо степени $\geq$ 4 гибкость получена, но для степени 3 точный результат пока неизвестен. В качестве продвижений к изучению этого случая была рассмотрена конкретная поверхность, для которой гибкость доказывать проще. Также рассматривались эквивалентные условия гибкости, конкретные виды конусов, которые возникают для этой поверхности. В качестве ознакомления с соответствующей техникой изучалась гибкость для поверхностей других степеней и конкретные способы покрывать конусы цилиндрами. Также рассмотрен метод, использование которого, скорее всего, позволит доказать гибкость для выбранной поверхности дель Пеццо степени 3.
В работе мы рассматриваем специальные дистанционные графы и оцениваем число ребер в их подграфах. Получена новая нижняя оценка числа ребер в определенных подграфах графа Джонсона. Полученные оценки улучшают известные результаты.
Классическая теорема Лебега может быть сформулирована в терминах непрерывных отображений квадрата в граф. А именно: для любого непрерывного отображения из квадрата в одномерный CW-комплекс имеется такая точка CW-комплекса, прообраз которой содержит точки противоположных ребер квадрата. Я расскажу об обобщении этого утверждения на случай непрерывных отображений из куба в граф.
Целью работы было доказать единственность предельного цикла в фазовом портрете автономной системы дифференциальных уравнений на плоскости, называемой брюсселятором. Доказать это планировалось несложными средствами вроде критерия Дюлака, ключевой математический объект которых -- это дивергенция векторного поля. Хотя итоговая цель и не достигнута, было проделано следующее:
1) создана компьютерная программа, чертящая фазовый портрет задаваемой пользователем автономной системы дифференциальных уравнений на участке плоскости; программа имеет дополнительный функционал для упрощения работы с дивергенцией поля, задаваемого системой;
2) опробованы разные варианты функций-множителей в критерии Дюлака в применении к частному случаю брюсселятора;
3) сделаны попытки применить к задаче некоторые средства функционального анализа.
Мы рассматриваем задачу децентрализованной оптимизации, где каждый агент имеет сильно выпуклую и гладкую функцию, а целью сети является минимизация суммы всех функций по узлам. В данной постановке можно рассматривать как статическую, так и изменяющуюся во времени сеть. В обоих случаях существуют оптимальные алгоритмы, нижние границы которых выражаются через $\chi$, число обсуловленности сети. Недавно были получены некоторые нижние оценки для задачи децентрализованной оптимизации при различных асимптотических ограничениях на скорость изменения сети. В данной работе мы показываем, что при константных ограничениях нижние границы такие же, как и в случае изменяющейся во времени сети, тем самым улучшая существующие результаты.
Исследуется структура многообразия операторов Роты-Бакстера веса 0 на алгебре $M_2(\mathbb{C})$. Описываются его неприводимые компоненты, особые точки и классы эквивалентности по сопряжённости автоморфизмами. Подобное описание упрощает результаты предыдущих классификаций таких операторов, уменьшая количество классов операторов и позволяя связать типы операторов и орбиты, в которых они лежат.
The proposed research entails a theoretical analysis of the convergence rate and efficiency of a novel distributed optimization method, which incorporates independent segmentation of gradient coordinates ($PermK$) followed by a greedy coordinate selection process ($TopK$) for each gradient segment. Our findings indicate that the new method attains comparable results to state-of-the-art techniques, such as $MARINA-PermK$ [Szlendak21] and $EF-TopK$ [Alistarh18] , in terms of zero-variance and general variance regimes, respectively. Additionally, the experimental performance of our approach is demonstrated through its application to quadratic problems and computer vision models.
The proposed research entails a theoretical analysis of the convergence rate and efficiency of a novel distributed optimization method, which incorporates independent segmentation of gradient coordinates ($PermK$) followed by a greedy coordinate selection process ($TopK$) for each gradient segment. Our findings indicate that the new method attains comparable results to state-of-the-art techniques, such as $MARINA-PermK$ and $EF-TopK$, in terms of zero-variance and general variance regimes, respectively. Additionally, the experimental performance of our approach is demonstrated through its application to quadratic problems and computer vision models.
Recently contrastive learning has regained popularity as a self-supervised representation learning technique. It involves comparing positive (similar) and negative (dissimilar) pairs of samples to learn representations without labels. However, false negative and false positive errors in sampling lead to the loss function bias. This paper analyzes various ways to eliminate these biases. Based on the fully-supervised case, we develop debiased contrastive models that account for same-label datapoints without requiring knowledge of true labels, and explore their properties. Using the debiased representations, we measure accuracy of predictions in the classification task. The experiments are carried out on the CIFAR10 dataset, demonstrating the applicability and robustness of the proposed method in scenarios where extensive labeling is expensive or not feasible.
В последнее время популярностью пользуется метод «Neural Radiance Field», предлагающий восстановить 3D сцену путем анализа двухмерной фотографии. К несчастью, результат восстановления очень сильно зависит от того, насколько качественными были входные данные - изображения, позы камер, семантические карты. В данной работе представлен новый метод на основе NeRF, который умеет восстанавливать сцену с новых ракурсов, а также карты семантической сегментации и два вида неопределенностей - для цвета и семантики. Кроме того, добавлена возможность активного обучения в нашу модель, когда новые кадры для добавления в обучающий датасет выбираются в зависимости от уменьшения обоих неопределенностей. Также для значительного увеличения производительности и качества использовано позиционным кодированием с помощью хеширования. Код будет находиться тут https://github.com/sevashasla/actsrf.
Large language models have achieved remarkable performance on a wide range of tasks that require natural language understanding. As recent studies show, they are able to solve tasks that require mathematical reasoning, such as solving problems and formalizing proofs. But how big are the language models needed for these tasks? We study whether it is possible to achieve comparable quality on open-source medium-sized models. We show that solving problems in natural language is possible on such models, while autoformalization requires larger ones.
С каждым днем в мире появляется все больше и больше данных, которых мы можем использовать для целей машинного обучения. Однако для классических методом обучения с учителем нужна разметка на данных, которая требует затрат человеко-часов и, соответственно, денег. Вот почему в последние годы все активнее развиваются техники обучения без учителя, которые не требуют предварительной разметки на данных. Для изображений является полезной задача создания эмбеддингов, поскольку они могут использоваться в различных задачах машинного обучения для повышения качества финальных моделей. Переход к подобным методам бесспорно является перспективным, но все же таит в себе много подводных камней с которыми придется столкнуться современной науке. в данной работе планируется подробнее рассмотреть влияние лосс-функции на итоговые представления.
Исследуется проблема снижения размерности пространства параметров модели машинного обучения. Решается задача восстановления временного ряда. Для восстановления используются авторегресионные модели: линейные, автоенкодеры, реккурентные сети ~--- с непрерывным и дискретным временем. Проводится метрический анализ пространства параметров модели. Предполагается, что отдельные параметры модели, случайные величины, собираются в векторы, многомерные случайные величины, анализ взаимного расположения которых в пространстве и представляет предмет исследования данной работы. Этот анализ снижает число параметров модели, оценивает значимости параметров, отбирая их. Для определения положения вектора параметров в пространстве оцениваются его матожидание и матрица ковариации с помощью методов \textit{бутстрэпа}, оценки в процессе \textit{SGD} и байесовской нейросети. Эксперименты проводятся на задачах восстановления синтетических временных рядов, квазипериодических показаний акселерометра, датасетах IRIS и MNIST.
Tensor based time series decomposition methods based on singular spectrum analysis showed great results in both denoising and interpretability. Several forecasting techniques based on them were already explored, yet none provided simultaneously accurate, stable and computationally cheap inferring. After an in-depth study of well known models we facilitated a new one comprising all three requirements for non-stationary quasi-periodic time series. The model was then tested on real-life data of electricity consumption and other well-explored datasets.
-
В работе сравниваются между собой пять популярных sampling-based алгоритмов, а именно RRT, RRT, Informed RRT, BIT и FMT, применяющихся в задаче планирования пути для робота-манипулятора. Для сравнения написан софт, позволяющий тестировать различные sampling-based алгоритмы, c помощью него проведены эксперименты.
Целью работы является разработка языка программирования, максимально удовлетворяещего требованиям при создании програмного обеспечения средней сложности.
Ревматоидный артрит - это аутоиммунное заболевание, которое поражает весь организм, вызывая хроническое воспаление, приводящее к разрушению суставов. В качестве оценки степени заболевания используется SvH метод. Он занимает много времени и является субъективным, но автоматизированная оценка суставов может преодолеть эти ограничения. В нашем исследование мы рассмотрели существующие методы решения данной задачи и предоставили свое, показывающее лучшее качество на наших данных.
В работе представлен метод тематического моделирования с использованием обратной связи от пользователя. Обратная связь заключается в определении принадлежности темы, полученной при тематическом моделировании, к одной из трёх категорий: релевантная, нерелевантная, «мусорная». Основная задача состоит в улучшении базовой модели, которое заключается в выделении новых релевантных тем при сохранении выделенных тем и уменьшении числа «мусорных» тем. В работе предлагается решение с использованием библиотек тематического моделирования и регуляризаторов сглаживания и декоррелирования. Вычислительный эксперимент проводится на текстовой коллекции, основанной на новостях сайта Lenta.ru, опубликованных в период с мая по август $2008$ года.
Первая часть данной работы заключалась в том, чтобы разобраться, что из себя представляют синтаксические деревья разбора для естественного языка. Была изучена соответствующая теория. Затем были изучены существующие деревья разбора для формул. Следующий шаг заключался в том, чтобы разобраться в понятии теории дискурса. Было рассмотрено, из каких элементов состоит описание теории дискурса. Были приведены примеры текста и формул, выписанных в теории дискурса. Была предпринята попытка взять дерево разбора для естественного языка и дерево разбора для формул и соединить их.
В данной работе исследуется поведение потока жидкости в T-shaped и Y-shaped микромиксерах. Задача состоит в том, чтобы предсказывать давление и скорость жидкости в каждой точке сосуда, зная начальные скорости на двух входах. В первой части работы поведение жидкости моделируется с использованием OpenFOAM, во второй строится нейронная сеть (PINN) на основе уравнения Навье-Стокса.
В этой работе представлено исследование в области мультиагентного обучения с подкреплением (MARL) и его применение в динамических играх двух лиц. Основное внимание уделяется задаче о сделке, в которой предлагается новая модификация. Рассматриваются различные методы MARL и возможность их применения для решения этой задачи. Также в работе представлена разработка модели искусственной нейронной сети, специально предназначенной для решения предложенной модифицированной задачи о сделке. Результаты могут стать ценным вкладом в области обучения с подкреплением и теории игр.
Современные операционные системы, используемые в аэрокосмической отрасли, должны обеспечивать высокую надежность и разрабатываются в соответствии со специальными стандартами. Одним из стандартов на программное обеспечение, используемое в бортовом оборудовании, является ARINC 653. Этот стандарт не определяет, как именно система должна отслеживать и реагировать на зависания, некорректную работу оборудования (например, единичные сбои, вызванные атмосферной радиацией) и другие проблемы, приводящие к нарушениям работы ОСРВ. Поэтому вопрос об эффективной обработке системой таких ситуаций остаётся открытым. В этом исследовании мы изучаем применимость сторожевых таймеров как части встроенной системы самопроверок (BITE) для решения этого вопроса и предлагаем конкретный метод обеспечения устойчивости для ОС, реализующих ARINC 653, основанный на использовании сторожевых таймеров для защиты системного таймера и системных разделов.
Детальный морфометрический анализ фазоконтрастных изображений обонятельной луковицы человека затруднен из-за недостаточного разрешения метода и собственного контраста реконструируемых изображений. Ранее с использованием нейросетевого подхода удалось выделить на изображениях отдельные слои луковицы. В данной работе была проведена разметка сечений обонятельной луковицы. А также представлен метод для сегментации клубочков нервных окончаний в GL-слое, основанный на нейросетевой модели.
Рассмотрены новые способы нумерации позвонков для облегчение и автоматизации работы врачей.
In this study, we explore the stochastic variation of a proposed Acc. GD algorithm for convex optimization problems expressed as r = p + q, where r is strongly convex, q is Lq-smooth and convex, and p is Lp-smooth. Substantiating and proving theoretical bounds of the convergence rate we expect a similarly high convergence rate and wider practical application. Comparing obtained convergence results with ones from the original article, we are trying to apply the algorithm to solve distributed problems of the master-worker type. Various tests were conducted, including speed comparisons in scenarios involving the first response from the worker or the average response from the workers, measuring the convergence rate with different batch sizes, and varying the number of steps of the proximal algorithm in cases where the solution is exact or inaccurate.
В этой работе рассматривается Колмогоровская сложность перечисления множеств. Существует два конкурирующих определения сложности: детерминированное $(I(S))$ и рандомизированное $(H(S))$. Можно показать, что $I(S) \geq H(S) + c$. Соловей [1] доказал, что выполняется $I(S) \leq 3 H(S) + 2 \log H(S) + c$. В этой работе, предполагая, что рандомизированная машина Тьюринга перечисляет множество в определенном порядке, доказывается, что оценку Соловея можно улучшить. А именно, если машина перечисляет числа в порядке возрастания, то верна оценка $I(S) \leq H(S) + 2 \log H(S) + c$. Если же машине разрешено перечислять числа в порядке увеличения их длины двоичной записи, то верна оценка $I(S) \leq 2 H(S) + 2 \log H(S) + c$. Этот результат можно применить, если рассмотреть конечный автомат вместо рандомизированной машины Тьюринга.
Задачи сравнения рандомизированной и детерменированной Колмогоровских сложностей сводятся к игре Мартина. Если для некоторой константы $c$ в $(\frac{1}{n}, cn^{\alpha})-$игре выигрывают кошки, то верно $I(S) \leq \alpha H(S) + O(log(H(S)))$ Если же выигрывают муравьи, то верно $I(S) \geq \alpha H(S) - O(log(I(S))$. В этой работе доказано выполнение инварианта для муравьев-родителей котов $|\textit{cover}(S)| \geq f(\mu(S))$ для некоторой функции $f$. Это позволяет доказать победу котов в $(\frac{1}{n}, n^{n})$-игре в общем случае, а также победу котов в $(\frac{1}{n}, n^{2})$-игре для достаточно хорошего класса игр.
Указанная задача очень тесно связана с вычислением некоторых сумм, которые в свою очередь связаны с вычислением интегралов. Моя работа в семестре заключалась сначала в изучении метода тригонометрических сумм, а затем поиске как можно более точной оценки связанных с ними интегралов.
Исследование состоит в том, чтобы выяснить, как неточность информации о сyбградиенте и/или целевой фyнкции может влиять на качество выдаваемого cубградиентным методом приближённого решения для задач минимизации слабо выпуклых функций с острым минимумом.
В этой работе описывается история и постановка транспортных задач Монжа и Канторовича, а также векторный аналог первой и идея её решения.
Оригинальная задача Канторовича имеет множество вариаций и возможных направлений для исследования. В данной работе мы рассмотрим вариант этой задачи, в которой оптимизируемая мера ограничена по плотности некоторой мажорантой. В частности нас интересует аппроксимация точки минимума посредством дискретного аналога задачи, что может быть полезно для практических нужд.
Гомологии Хованова - важнейший инвариант теории узлов, имеющий несколько обобщений: во-первых, на танглы и во-вторых, на виртуальные узлы. Наш интерес представляет возможность построить теорию гомологий Хованова для виртуальных танглов. Для этого было предложено подробно изучить методы, используемые в обобщениях и их вариации; классифицировать классы эквивалентностей погруженных поверхностей между виртуальными танглами. Мы обсудим возможные подходы к решению этих задач.
Цель данной работы состоит в том, чтобы показать, что классические косы вкладываются в классические танглы, то есть доказать, что если две классические косы эквивалентны как танглы, то они эквивалентны как косы. Разобран случай с косами из двух нитей.
В результате работы был разработан учебно-методический комплект из сборника задач и методического пособия по дискретной математике для школьников. В программе заложено 4 основных теоретических блока: математическая логика, теория множеств, комбинаторика и теория графов. В результате изучения вышеперечисленных тем, планируется улучшить предметные навыки, привить понимание аксиоматического подхода, развить абстрактное мышление и добиться более глубокого понимания направления ИТ в целом.
The family ${D_1,..., D_s}$ is called a sunflower of size s and with kernel $C$, if $D_i \cap D_j = C$ holds for all $1\leq i < j \leq s$ (we assume also $D_i \neq D_j$).
For $r\geq1, \mathcal{F}$ - r-spread, if $|\mathcal{F}(X)|\leq r^{-|X|}|\mathcal{F}|, \forall X \subset [n]$, where $\mathcal{F}(S):=\{A\backslash S:A\in\mathcal{F}, S\subset A\}$
The idea of our work is to construct spread approximation (such a small r-spread (for some r) hypergraph of low uniformity that most of the edges of the original graph contain at least one of its edges) of family and to estimate the maximum size of a sunflower-free family via this approximation and its reminder
Пусть $\mathcal{M}$ - метрическое пространство, содержащее хотя бы $2$ точки.
Хроматическим числом $\chi(\mathbb{R}_p^n, \mathcal{M})$ называется наименьшее число цветов, необходимое для покраски всех элементов $\mathbb{R}_p^n$ таким образом, чтобы не было одноцветных изометричных копий $\mathcal{M}$. В данной работе изучены хроматические числа для класса нормальных раскрасок при $p \in 2\mathbb{N}$ и $\mathcal{M} = \mathcal{B}_k$ - арифметическая прогрессия длины $k$.
Информация Фишера - мощный инструмент, который может использоваться для решения таких насущных проблем. Эта работа предоставляет решение для оптимизации стратегии времени эксперимента, состоящего в измерении спектра. Эта оптимизация приводит к снижению ошибки целевого параметра, например, массы частицы.