Conveners
20-Машинное обучение и нейросети
- Kirill Ivanov (Moscow Institute of Physics & Technology (MIPT))
20-Машинное обучение и нейросети
- There are no conveners in this block
Работа посвящена исследованию уязвимостей LLM-агентов, интеграция которых в бизнес-процессы (клиентская поддержка, управление данными) сопровождается рисками утечек информации, финансовых потерь и репутационного ущерба. На основе анализа 15+ научных работ (2023–2025 гг.) и реальных инцидентов (взлом ChatGPT, манипуляция агентом Microsoft Tay) систематизированы ключевые типы атак: джейлбрейки,...
\section{Аннотация}
В данной работе рассматривается применение сетей Колмогорова-Арнольда (далее - KAN) в задачах computer vision. Были рассмотрены классические датасеты, такие как MNIST, CIFAR10, CIFAR100, показана неэффективность использования KAN в качестве выходного слоя в задачах классификации. Также был выделен класс задач, в котором использоание KAN - наиболее эффективно....
В работе рассматриваются различные формы применения periodic embeddings с такими моделями, как MLP. Проводятся эксперименты по обучению периодических весов на разных датасетах и моделях.
Генеративные модели большого масштаба продемонстрировали выдающиеся результаты в задаче синтеза изображений по текстовому описанию. Одним из ключевых направлений их применения является генерация персонализированных изображений. Распространённые подходы к персонализации, как правило, предполагают использование дополнительных входных данных, таких как элементы контроля или множество ракурсов...
В данной работе рассматривается применение мультимодальных языковых моделей (MLLM) к задаче визуального вопросно-ответного анализа (Video Question Answering, VideoQA) на основе видеоданных. Предложеный модульный подход включает отбор ключевых кадров с использованием CLIP, построение графа сцены по пространственно-семантическим отношениям между объектами с помощью MLLM и генерацию ответа на...
Исследование посвящено улучшению методов прогнозирования и классификации временных рядов с длинными и сложными зависимостями. Предложен гибридный подход, основанный на контрастивном обучение для преобразования данных в векторное представление, который объединяет несколько методов. Он адаптивно учитывает корреляцию данных, эффективно обрабатывает сложные зависимости и минимизирует...
Understanding how a neural network’s loss landscape changes as we add more training data is important for efficient training. Although larger datasets reshape this high-dimensional surface, the point when extra data stop making a big difference is unclear. We show that near a local minimum the loss landscape stabilizes once the dataset exceeds a certain size. To study this, we project the full...
Проект посвящен разработке методов локализации робота в условиях отсутствия спутниковых сигналов с использованием графа 3D-сцены. Основная задача включает отслеживание перемещения объектов по последовательности изображений и прогнозирование изменений сцены. В работе проведен анализ современных методов трекинга, таких как CoTracker3 и SAM-2, выбрана оптимальная модель, а также разработан...
This work investigates a hybrid approach to financial forecasting that integrates sentiment analysis of investor-generated content with traditional technical indicators. Experimental results showed that incorporating sentiment data significantly improves predictive accuracy when combined with technical features. Two neural network models: RuBERT and FISHQA—are compared for their effectiveness...
Разработан zero-shot алгоритм генерации семантического графа сцены (SG) для одиночных RGB-изображений, предназначенный для визуальной локализации роботов. Пайплайн RAM++ → YOLO-World → MobileSAM извлекает маски объектов; далее numpy C-расширение формирует граф контактов, а jina-CLIP-v1 выбирает предикаты по косинусному сходству без дообучения. На Visual Genome достигнут mR@100 = 8.9 % (задача...
В работе рассматривается задача обработки изображений, полученных со сканера паспорта РФ с разными типами оптической подсветки. Целью исследования является устранение бликов и других артефактов, мешающих анализу защитных элементов документа. Воспроизведён бейслайн-метод, изначально реализованный в драйверах сканера, который позволял частично улучшить качество изображения, но не решал задачу...
В работе рассматривается метод распознавания рукописных символов на графовом представлении изображений с использованием сверточных графовых нейросетей. Предложенный подход позволяет сократить объем памяти и повысить эффективность по сравнению с классическими сверточными сетями.
В данной работе рассматривается распознавание текста на основе скелетного представления линий с шириной. Сравниваются различные подходы построения графовых моделей для классификации символов. При этом учитываются размеры моделей поскольку цель работы - сделать оптимальную по потребляемым ресурсам модель
Representing molecular structures effectively in chemistry remains a challenging task, with both string- and graph-based approaches commonly employed. Language models and graph-based models are extensively utilized within this domain, consistently achieving state-of-the-art results across an array of tasks. However, the prevailing practice of representing chemical compounds in the SMILES...