Методы DL (глубокое обучение) исторически не выигрывали у классических ML-моделей на задачах с табличными данными, состоящими из категориальных, бинарных и числовых признаков. Более того, модели основанные на градиентном бустинге решающих деревьев (как СatBoost, XGBoost) зачастую значительно выигрывали нейросети. Однако современные модели, основанные на полносвязных сетях (MLP) начали...
Предлагается метод цифровой генерации редких специфических гистологических окрасок (Masson’s Trichrome, PAS, Ki-67 и др.) на основе стандартных гематоксилин-эозиновых (H&E) изображений с использованием генеративно-состязательных сетей (GAN). Показана возможность преодоления проблемы отсутствия точного пространственного соответствия между парами изображений при помощи архитектуры CycleGAN....
В этом отчете будет представлено исследование влияния техники рестартов на оптимизацию обучения сверхпараметризованных моделей. Исследуется теоретическая связь между обобщенной (L_0, L_1)-гладкостью функций потерь и явлением двойного спуска, характерным для сверхпараметризованных моделей. Основная гипотеза исследования состоит в том, что рестарты в градиентных методах могут выполнять роль...
Crucial for large-scale models, federated learning faces two major challenges: privacy preservation and high communication costs. While SignSGD addresses the communication issue by transmitting only gradient signs, its only earlier proposed private version lacks proper privacy guarantees and convergence analysis. We construct a new variant of DP-SignSGD that combines Gaussian noise with...
Оптимизация транспортных сетей – это задача, направленная на эффективное управление потоками (грузов, данных и т.д.) с целью минимизации издержек, времени или загруженности сети, либо максимизации её пропускной способности. В данной работе исследуются различные модификации алгоритма Гарга-Кённемана, для решения данных задач, и анализируется его связь с методами онлайн-оптимизации. В частности,...
Данная работа является частью большой статьи Д.А. Пасечнюка, в которой теоретическая верхняя граница максимально допустимого уровня аддитивного шума (MALN) в выпуклой, непрерывной по Липшицу оптимизации нулевого порядка используется, чтобы установить соответствующие верхние границы для классов сильно выпуклых и гладких задач. В этой работе неконструктивно была получена граница для гладкого...
В работе исследуется проблема дообучения больших языковых моделей (LLM) в условиях ограниченных ресурсов. Под ограниченными ресурсами понимается видеопамять, человеческое участие и время обучения. В работе рассматриваются модели до 1.5B. Предлагается метод дообучения, основанный на внедрении адаптеров LoRA, малоранговых раложений матриц, в слои архитектуры трансформера, и использовании...
В данной работе исследуется применение методов оценки неопределенности для повышения качества детекторов машинно-сгенерированного текста при обработке данных, содержащих атаки, такие как омоглифы, перефразирование и зашумление. Эти атаки не только позволяют обходить детекцию, но и служат для тестирования устойчивости детекторов. Мы проверяем гипотезу о том, что методы оценки неопределенности...
В работе предлагается стратегия дообучения LLM Последнего слова сначала, которая переносит ключевое для рифмовки слово в начало каждой строки, сохраняя при этом левосторонний порядок генерации и тем самым позволяя использовать преимущества предварительно обученных моделей. Эксперименты на корпусе песенных текстов на английском, что данная стратегия значительно повышает точность рифмовки и...
В данной работе рассматривается задача классификации многомерного временного ряда, представляющего собой электроэнцефалограмму головного мозга человека. Стандартные подходы, использующие двухмерные свертки, не могут учесть пространственную структуру сигнала, поскольку датчики, считывающие показатели, находятся на сферической поверхности. В качестве решения предлагается использовать графовое...
Идентификация человека по походке является перспективным методом биометрической аутентификации, позволяющим распознавать личность на расстоянии без физического контакта. Проект направлен на разработку инструмента, который использует методы машинного обучения для анализа статических и динамических характеристик движения для идентификации. С помощью стереокамеры Realsense и алгоритма...
В работе исследуются различные уязвимости в написании smart contacts на блокчейне Ton. Авторами разработан инструмент, позволяющий находить и предотвращать проблемы в коде до развертывания контрактов в основной сети.
В работе исследуются различные уязвимости в написании smart contacts на блокчейне Ton. Авторами разработан инструмент, позволяющий находить и предотвращать проблемы в коде до развертывания контрактов в основной сети.
В данной работе рассматривается модификация безградиентного метода Stochastic Three Points (STP). Ожидается получить ускорение в теоретических оценках сходимости, а также улучшение (в среднем) на практике.
В работе исследуется возможность использования языковых моделей (LLM) для автоматической разметки семантических ролей (Semantic Role Labeling, SRL) в русскоязычных текстах. Предложен подход на основе few-shot обучения с использованием корпуса FrameBank. Проведено сравнение эффективности модели Gemini 2.5 Flash с традиционными методами SRL.
Данная работа посвящена сравнительному анализу эффективности технологий параллельного программирования MPI и OpenMP для вычислительных задач. В работе исследуются особенности архитектуры и масштабируемость этих технологий на многопроцессорных и многопоточных системах, применение MPI для распределенных вычислений и OpenMP для параллельной обработки в рамках общей памяти.
В работе исследуются способы решения задачи Query Optimization. Рассматриваются конкретные решения, использующие метод многоруких бандитов. Среди таких решений выделяется одно конкретное с названием Bao, использующее семплирование Томпсона. Данное решение требует проверки на практике, а также исследования на возможность доработки. Проверка производится с помощью датасета, построенного на базе...
This paper studies the targeted college admission problem,
where students are matched to schools and firms simultaneously. We analyze conditions for stable matchings, demonstrating existence under structured preferences (e.g., homogeneous firm-school rankings or fixed capacities) and providing counterexamples where stability fails. An adapted
deferred acceptance algorithm is proposed for...
Строится исчисление концов метрических пространств относительно грубых и других аналогичных отображений. Получены формулы, связывающие концы метрических пространств при наличии накрытия (грубого или обладающего свойством поднятия путей) одного пространства другим. Доказано, что при таких отображениях количество концов не увеличивается. Важный пример применения этих результатов – исследование...
Для простого $p\geq 3$ кривая Ферма $x^p+y^p=z^p$ разветвлённо накрывает прямую. Промежуточные кривые при этом накрытии - кривые Фаддеева. Они также описываются уравнениями $y^p=x^k(x+1)$, где $k\in\{1,2,\ldots,p-2\}$. В этой работе рассмотрены некоторые свойства групп автоморфизмов кривых Фаддеева. Кроме того, приведён достаточно простой и естественный способ выпуклой триангуляции...
В работе рассматриваются некоторые свойства скалярного произведения на пространстве квадратично интегрируемых по банаховой мере функций.
В частности, мы исследовали, что
функции $\{\exp{(i\alpha x )},\, \alpha\in\mathbb{R} \}$ образуют континуальную ортонормированную систему, и что
ядро преобразования Фурье по банаховой мере, действующего в пространство со считающей мерой, является...
Доклад будет про диофантовы приближения на квадратичных поверхностях, по разным нормам. Предполагаемый результат - уменьшение некоторых констант, а также обобщение некоторой теоремы о приближении по одной норме, с заменой на приближение одновременно по нескольким нормам.
Abstract:
Мы расширяем результат статьи Gloeckle (2024), заключающийся в том, что LLM обученная с несколькими дополнительными головами (используя метод multi token prediction) получается лучшего качества. В нашей работе мы показываем, что используя multi token prediction, можно улучшить также качество Fine Tuning-а моделей. Также в данной работе улучшения появляются начиная с размера...
Несмотря на значительные успехи глубокого обучения в обработке изображений и текстов, его применение к табличным данным традиционно сталкивалось с существенными ограничениями. Ансамблевые методы, такие как XGBoost и CatBoost, долгое время демонстрировали превосходство над нейронными сетями в задачах обработки табличных данных, сочетающих категориальные, числовые и бинарные признаки. Однако в...
Абстракт. Задача визуального определения местоположения (visual place recognition) является ключевой для обеспечения надежной локализации и навигации автономных роботов. Однако использование визуальных данных сопряжено с трудностями, связанными с изменением ракурса камеры и частичными изменениями окружающей сцены, например, из-за перемещения объектов. Алгоритм SegVLAD предлагает решение этих...
В современном мире активно используются языковые модели и не менее важно их правильное дообучение (fine-tuning), например, техника low rank adaptation (LoRA), которая добавляет к выделенным слоям тренируемые параметры. Однако LoRA требует много памяти для достижения точных результатов, потому что на все слои добавляются адаптеры одинаковых рангов, и интуиции, на какие слои ее необходимо...
Language models have become central to many AI applications. Effective fine-tuning
is essential to adapt these models to specific tasks. Traditional methods like Low-Rank
Adaptation (LoRA) add fixed-rank adapters to all layers, often resulting in memory
inefficiency due to non-optimal layer selection. We propose SimplexLoRA, a novel
fine-tuning framework that adaptively scales adapter...
In this paper, we address the problem of detecting manipulations in biological images. Ensuring the integrity of biological image data is essential for reliable scientific research. The study focuses on developing a model for pairwise image comparison using contrastive learning, demonstrating high pairwise comparison metrics to detect manual modifications or more subtle alterations. The...
Тезис:
В связи с улучшением качества машиносгенерированных изображений становится очень сложно отличать реальное изображение от сгенерированных. Существующие на данный момент решения имеют низкую обобщающую способность. В этой статье рассматриваются разные модели, в том числе несвязанные с нейронными сетями. Также используется вся существующая информацию и модели, для подбора наилучшего...
В наше время понимание того, как мозг воспринимает и обрабатывает внешние раздражители, имеет ключевое значение для развития нейронауки и совершенствования методов диагностики. В данной работе мы исследуем взаимосвязь между восприятием человеком окружающего мира и сигналами, регистрируемыми фМРТ-сканером. Анализ направлен на выявление корреляции между последовательностью фМРТ-изображений и...
В задачах промышленного контроля качества с использованием компьютерной томографии (КТ) критически важна точная сегментация внутренних дефектов объектов, таких как пористость, трещины и инородные включения. Несмотря на широкое распространение в медицине, современные нейросетевые архитектуры ещё не получили должного распространения в промышленной КТ.
В рамках данной работы был проведён...
Устная речь широко используется психиатрами для описания психического состояния пациентов, например выявления депрессии. Наиболее распространенный способ оценки степени депрессии это шкала Гамильтона(HDRS). Результаты ее применения все равно достаточно субъективны, поэтому возможность использования методов машинного обучения крайне актуальна. Доступность предобученных больших мульти-язычных...
Устная речь широко используется психиатрами для описания психического состояния пациентов, например выявления депрессии. Наиболее распространенный способ оценки степени депрессии это шкала Гамильтона(HDRS). Результаты ее применения все равно достаточно субъективны, поэтому возможность использования методов машинного обучения крайне актуальна. Доступность предобученных больших мульти-язычных...
В то время как ансамблевые методы традиционно обучают модели независимо, в этой статье исследуется смешанный подход,
который сочетает независимое обучение с оптимизацией совместных потерь. Удивительно, но эта идея имеет потенциал
в нескольких вариантах ансамблевого обучения. Наше направление относится к федеративному обучению (FL),
где мы стремимся обучать ансамбль как глобальную модель. Мы...
Пока традиционные методы ансамблирования обучают модели независимо, в данный работе исследуется гибридный подход, комбинирует независимое обучение с "joint loss"-оптимизацией. Неожиданно эта идея имеет потенциал в нескольких вариантах обучения ансамблей. Первый -- это "aligned training", где члены обучаются строить наиболее скоординированные прогнозы. Второе направление относится к...
Работа посвещена проблеме эквифинальностей моделей в области гидрологического прогнозирования. Исследуются классические модели машинного обучения на их восприимчивость к важным статическим характеристикам датасетов.
Вариационные неравенства (VI) появились как универсальная структура для решения широкого круга задач.Стохастические методы оказались мощными инструментами для решения таких задач, но они часто страдают от неустранимой дисперсии, что требует разработки методов снижения дисперсии. В этой работе мы предлагаем новый алгоритм со сниженной стохастической дисперсией для решения стохастических...
Работа посвящена исследованию уязвимостей LLM-агентов, интеграция которых в бизнес-процессы (клиентская поддержка, управление данными) сопровождается рисками утечек информации, финансовых потерь и репутационного ущерба. На основе анализа 15+ научных работ (2023–2025 гг.) и реальных инцидентов (взлом ChatGPT, манипуляция агентом Microsoft Tay) систематизированы ключевые типы атак: джейлбрейки,...
In [1], an information-theoretic model of massive uncoordinated multiple access was introduced and a random coding bound was obtained that can be applied in both asymptotic and non-asymptotic regimes. An improvement for the asymptotic regime was proposed in [2] using Gordon’s lemma on the minimum of a Gaussian process. In this work, we are going to prove a non-asymptotic analogue of the second...
\section{Аннотация}
В данной работе рассматривается применение сетей Колмогорова-Арнольда (далее - KAN) в задачах computer vision. Были рассмотрены классические датасеты, такие как MNIST, CIFAR10, CIFAR100, показана неэффективность использования KAN в качестве выходного слоя в задачах классификации. Также был выделен класс задач, в котором использоание KAN - наиболее эффективно....
Мы предлагаем новый стохастический алгоритм ExtraSAGA для решения вариационных неравенств, сочетающий преимущества ExtraGradient и SAGA с редукцией дисперсии. Теоретически доказана сходимость метода, а его эффективность подтверждена различными экспериментами. Работа расширяет возможности применения VI в оптимизации и машинном обучении.
В работе рассматриваются различные формы применения periodic embeddings с такими моделями, как MLP. Проводятся эксперименты по обучению периодических весов на разных датасетах и моделях.
В ходе рассмотрения топологических путей решения двойственной задачи линейного программирования возникло несколько проблем. Одна из них заключается в том, что отстутствует чёткий алгоритм для нахождения сбалансированного множества в Теореме Комии. В данном докладе будет рассмотрено алгоритмическое доказательство более слабой Теоремы KKMS, но важной для понимания, как можно было обобщить...
Генеративные модели большого масштаба продемонстрировали выдающиеся результаты в задаче синтеза изображений по текстовому описанию. Одним из ключевых направлений их применения является генерация персонализированных изображений. Распространённые подходы к персонализации, как правило, предполагают использование дополнительных входных данных, таких как элементы контроля или множество ракурсов...
In Machine Learning, the non-smoothness of optimization problems, the high cost of communicating gradients between workers, and severely corrupted data during training necessitate further research of optimization methods under broader assumptions. This paper explores the efficacy of sign-based methods, which address slow transmission by communicating only the sign of each stochastic gradient....
В данной работе рассматривается применение мультимодальных языковых моделей (MLLM) к задаче визуального вопросно-ответного анализа (Video Question Answering, VideoQA) на основе видеоданных. Предложеный модульный подход включает отбор ключевых кадров с использованием CLIP, построение графа сцены по пространственно-семантическим отношениям между объектами с помощью MLLM и генерацию ответа на...
В данной работе рассмотрены классические методы разделения операторов для решения ОДУ. Были получены общие локальные ошибки классических методов, а также оценки на норму коммутаторов, которые позволили оценить данные ошибки сверху. Также был построен обобщенный симметричный метод в случае разбиение исходного дифференциального уравнения на $N$ векторных полей, проведены оценки локальной ошибки...
Исследование посвящено улучшению методов прогнозирования и классификации временных рядов с длинными и сложными зависимостями. Предложен гибридный подход, основанный на контрастивном обучение для преобразования данных в векторное представление, который объединяет несколько методов. Он адаптивно учитывает корреляцию данных, эффективно обрабатывает сложные зависимости и минимизирует...
Understanding how a neural network’s loss landscape changes as we add more training data is important for efficient training. Although larger datasets reshape this high-dimensional surface, the point when extra data stop making a big difference is unclear. We show that near a local minimum the loss landscape stabilizes once the dataset exceeds a certain size. To study this, we project the full...
Задача линейного программирования (ЛП)(1) является одной из самых распространенных задач, к которой можно свести очень большой класс проблем. Она имеет эффективный метод решения - Simplex-method, однако асимптотика его решения при некоторых условиях может вырождаться в экспоненциальную, что является неэффективно, однако в среднем она имеет линейную асимптотику, что приемлемо для этой задачи....
В работе предлагается обобщение метода кубической регуляризации Ньютона на случай $(L_0, L_1, L_2)$-гладкости третьего порядка. Показано, как адаптивный выбор параметра регуляризации позволяет обеспечить сходимости без предположения о глобальной ограниченности $\nabla^3 f(x)$. Представлены теоретические выкладки, оценка остаточного члена с помощью неравенства Гронуолла.
Проект посвящен разработке методов локализации робота в условиях отсутствия спутниковых сигналов с использованием графа 3D-сцены. Основная задача включает отслеживание перемещения объектов по последовательности изображений и прогнозирование изменений сцены. В работе проведен анализ современных методов трекинга, таких как CoTracker3 и SAM-2, выбрана оптимальная модель, а также разработан...
В работе исследуется асимптотическое поведение функции Беллмана ( V(t, x) ) в задачах оптимального управления с особыми режимами второго порядка. Основное внимание уделено построению оценок сингулярных составляющих решения уравнения Гамильтона-Якоби-Беллмана (HJB) вблизи особых траекторий, а также анализу устойчивости таких решений. Предложен метод регуляризации вырожденного гамильтониана и...
This work investigates a hybrid approach to financial forecasting that integrates sentiment analysis of investor-generated content with traditional technical indicators. Experimental results showed that incorporating sentiment data significantly improves predictive accuracy when combined with technical features. Two neural network models: RuBERT and FISHQA—are compared for their effectiveness...
В настоящее время важной задачей математической оптимизации стало федеративное обучение, когда данные и/или части оптимизируемой функции распределены между множеством клиентских устройств и сервером, содержащим большую часть данных и обладающим наибольшими вычислительными мощностями. В такой ситуации ключевым становится не количество итераций алгоритма, а количество коммуникаций между клиентом...
Разработан zero-shot алгоритм генерации семантического графа сцены (SG) для одиночных RGB-изображений, предназначенный для визуальной локализации роботов. Пайплайн RAM++ → YOLO-World → MobileSAM извлекает маски объектов; далее numpy C-расширение формирует граф контактов, а jina-CLIP-v1 выбирает предикаты по косинусному сходству без дообучения. На Visual Genome достигнут mR@100 = 8.9 % (задача...
В последние годы одной из ключевых задач математической оптимизации стало федеративное обучение — сценарий, в котором данные и/или компоненты оптимизируемой функции распределены между множеством клиентских устройств и центральным сервером, обладающим наибольшими вычислительными ресурсами и часто хранящим основную часть данных. В таких условиях важную роль играет не столько количество итераций...
В работе рассматривается задача обработки изображений, полученных со сканера паспорта РФ с разными типами оптической подсветки. Целью исследования является устранение бликов и других артефактов, мешающих анализу защитных элементов документа. Воспроизведён бейслайн-метод, изначально реализованный в драйверах сканера, который позволял частично улучшить качество изображения, но не решал задачу...
В работе рассматривается метод распознавания рукописных символов на графовом представлении изображений с использованием сверточных графовых нейросетей. Предложенный подход позволяет сократить объем памяти и повысить эффективность по сравнению с классическими сверточными сетями.
Ищется оптимальная конструкция кодов-векторов для передачи сообщений с минимумом ошибок. Рассматривается случай сферы внутри n-мерного пр-ва, n+1 вектора и белого гауссовского шума. Утверждается, что тогда наилучшим расположением будут вершины правильного n-мерного симплекса.
В данной работе рассматривается распознавание текста на основе скелетного представления линий с шириной. Сравниваются различные подходы построения графовых моделей для классификации символов. При этом учитываются размеры моделей поскольку цель работы - сделать оптимальную по потребляемым ресурсам модель
В докладе будет рассказано об общих идеях нескольких работ последних лет, в которых улучшаются верхние оценки для диагональных чисел Рамсея. Основное внимание будет уделено следующим двум теоремам.
1. Для всех достаточно больших $k \in \mathbb{N}_1$ имеет место неравенство $R_2(k) \leq 3.8^{k + o(k)}$.
2. Для каждого $r \in \mathbb{N}_1$, $r \geq 2$ существует такое $\delta = \delta(r) > 0$,...
Representing molecular structures effectively in chemistry remains a challenging task, with both string- and graph-based approaches commonly employed. Language models and graph-based models are extensively utilized within this domain, consistently achieving state-of-the-art results across an array of tasks. However, the prevailing practice of representing chemical compounds in the SMILES...
Данная работа посвящена исследованию вычислительной сложности настольных и компьютерных игр. Основной результат заключается в доказательстве PSPACE-полноты игры Diamond Rush с использованием подхода, изложенного в книге Games, Puzzles, and Computation авторов R.A.Hearn и E.D.Demaine.
В данной работе изучаются оценки чисел Рамсея, обобщённые на случай произвольных последовательностей графов. Вводятся обобщения классического числа Рамсея: $R_{\min}(\{G_n\}, k)$ — минимальное число $m$ для натурального $k$, при котором в любом остовном подграфе $G$ или его дополнении $G_m \setminus G$ содержится индуцированный подграф изоморфный некому индуцированному подграфу $G_m$ на $k$...
Распространенным способом съемки гиперспектрального изображения (ГСИ) является линейное сканирование, при котором камера движется относительно сцены, и изображение регистрируется построчно. При такой съемке с борта летательного аппарата камера движется нестабильно, что приводит к искажениям на результирующем ГСИ. Для компенсации этих искажений используют гиростабилизированный подвес камеры, а...
Экстракторы - это функции, преобразующие источники случайности в близкие к равномерным. Существование экстракторов с хорошими параметрами может быть доказано вероятностным методом, но для приложений нужны явные конструкции. В работе представлены современные результаты по явным конструкциям экстракторов с одним и двумя независимыми источниками. Изложена конструкция экстрактора с одним...
Работа посвящена исследованию динамики мнений пользователей социальной сети ВКонтакте. На основе лонгитюдных данных предлагается провести имитационное моделирование, чтобы выявить влияние структуры социального окружения на изменение взглядов, особенно у пользователей с умеренными позициями.
В работе рассматриваются числа ван дер Вардена для многомерных арифметических прогрессий. Дано определение многомерной прогрессии и обосновано существование соответствующих чисел w(l₁; l₂; … ; lₘ; r). Приводится верхняя оценка этих чисел на основе классической теоремы ван дер Вардена и теоремы Гауэрса.
В данной работе исследуется методика применения обновлений к разделам ARINC-653 совместимой операционной системы реального времени (ОСРВ) без перезагрузки. Будет описан имеющийся в рассматриваемой ОСРВ программный интерфейс для применения горячих обновлений и будут исследованы способы его использования для обновлений различного объёма.
Данная работа ставит своей целью создание инструмента общего назначения для автоматизированного динамического анализа поведения ПО под Android. Разработанный инструмент основан на фреймворке Frida и предназначен для отслеживания вызовов Java-методов (call monitoring) в целевых процессах, с фокусом на Android API, но с возможностью трассировки и пользовательского кода. В отличие от классических...
В работе исследуются методы построения моделей временных рядов для прогнозирования нагрузочных характеристик серверов в кластере с целью оптимизации баланса между затратами на аренду вычислительных ресурсов и скоростью обработки запросов. Рассматриваются подходы к краткосрочному и долгосрочному прогнозированию на основе синтетических и реальных данных.
Работа посвящена теме механизма аннотации типов в языках программирования. Проведена имплементация механизма в развивающийся язык Étude, представлено сравнение языка с альтернативами. Исследовано влияние механизма аннотации типов на продуктивность при написании кода.
В настоящее время при изучении поведения людей в социальных группах все чаще используются большие языковые модели (LLM). Классические многоагентные модели не могут описывать всю комплексность человеческого поведения: к примеру, общение между агентами они описывают как обмен некоторыми численными характеристиками, упрощенно имитирующими взгляды или аргументы реальных людей, что крайне далеко от...
Разрабатывается метод автоматической калибровки томографической установки. По набору снимков будут определятся наиболее важные геометрические параметры установки. На данный момент введён в рассмотрение наклон оси фантома, что дало уменьшение ошибки аппроксимации в 2 раза. Планируется ввести в рассмотрение другие параметры и предложить метод представление результатов в более удобном виде.
В настоящей работе рассматривается задача предкомпенсации изображений, направленная на улучшение восприятия цифровых изображений на дисплеях у пользователей с рефракционными аномалиями зрения. Предложен новый метод предкомпенсации, основанный на использовании алгоритма полуквадратичного разделения (HQS) для решения задачи оптимизации функционала, характеризующего качество предкомпенсации....
В работе представлены результаты исследования методов сжатия данных для задач метеорологии и климатического моделирования. Проведён сравнительный анализ алгоритмов сжатия с потерями и без потерь, адаптированных к форматам NetCDF и HDF5. На основе метрик сохранения информации и вычислительной эффективности предложены рекомендации по выбору методов для различных типов данных. Результаты...
В работе представлены результаты исследования методов сжатия данных для задач метеорологии и климатиче-
ского моделирования. Проведён сравнительный анализ алгоритмов сжатия с потерями и без потерь, адаптиро-
ванных к форматам NetCDF и HDF5. На основе метрик сохранения информации и вычислительной эффектив-
ности предложены рекомендации по выбору методов для различных типов данных. Результаты...
Работа посвящена адресной кластеризации как первому этапу де-анонимизации пользователей Bitcoin. Оценивается совокупность классических и дополнительных эвристик, причём их вклад измеряется изменением коэффициента кластеризации r = |C| / |S|.