Отчетная конференция научного трека инновационного практикума ФПМИ 2025

Name: Отчетная конференция научного трека инновационного практикума ФПМИ 2025
Start: 2025-05-17T12:30:00+03:00
End: 2025-05-20T20:00:00+03:00
Location: МФТИ

17–20 May 2025

МФТИ

Europe/Moscow timezone

Кирилл Иванов

ivanov.km@mipt.ru

Безопасность LLM-агентов

20 May 2025, 12:40

12m

107 БК (МФТИ)

107 БК

МФТИ

Машинное обучение и нейросети 20-Машинное обучение и нейросети

Леонард Касерес Гутьеррес

Работа посвящена исследованию уязвимостей LLM-агентов, интеграция которых в бизнес-процессы (клиентская поддержка, управление данными) сопровождается рисками утечек информации, финансовых потерь и репутационного ущерба. На основе анализа 15+ научных работ (2023–2025 гг.) и реальных инцидентов (взлом ChatGPT, манипуляция агентом Microsoft Tay) систематизированы ключевые типы атак: джейлбрейки, эксплуатация API и непрямое внедрение вредоносных промптов через сторонние ресурсы. Критически оценен бенчмарк Agent Security Bench (ASB), чьи методы предполагают знание внутренней архитектуры агентов, что ограничивает их применимость. В качестве альтернативы предложена концепция унификации проверочных агентов, основанная на формализации атак и динамической генерации тестовых сценариев. Несмотря на незавершенность реализации фреймворка, работа формирует основу для создания адаптивных систем защиты, способных эволюционировать вместе с угрозами.

Леонард Касерес Гутьеррес

Алексей Гончаров (Зав лаборатории машинного интеллекта МФТИ)

ml_Leonard_Caceres.docx

Secure AI.pdf

Отчетная конференция научного трека инновационного практикума ФПМИ 2025

Кирилл Иванов

Безопасность LLM-агентов

107 БК

МФТИ

Speaker

Description

Primary author

Co-author

Presentation materials