Отчетная конференция научного трека инновационного практикума ФПМИ 2025

Name: Отчетная конференция научного трека инновационного практикума ФПМИ 2025
Start: 2025-05-17T12:30:00+03:00
End: 2025-05-20T20:00:00+03:00
Location: МФТИ

17–20 May 2025

МФТИ

Europe/Moscow timezone

Кирилл Иванов

ivanov.km@mipt.ru

Локализация по графу сцены

18 May 2025, 15:54

12m

Клуб Выпусников

ТЦ Дирижабль, ул. Первомайская 3а

Машинное обучение и нейросети 18-Машинное обучение и нейросети

Timophey Kondrashov

Абстракт. Задача визуального определения местоположения (visual place recognition) является ключевой для обеспечения надежной локализации и навигации автономных роботов. Однако использование визуальных данных сопряжено с трудностями, связанными с изменением ракурса камеры и частичными изменениями окружающей сцены, например, из-за перемещения объектов. Алгоритм SegVLAD предлагает решение этих проблем, формируя эмбеддинги не для всего изображения целиком, а для его отдельных сегментов. В оригинальной версии SegVLAD визуальные признаки извлекаются с помощью DINOv2, а агрегация осуществляется методом VLAD. В данной работе предпринимается попытка улучшения этого подхода путём замены данной связки на более современный метод Bag of Queries, специально разработанный для задач визуального определения местоположения.

Timophey Kondrashov

Александр Мелехин (Центр когнитивного моделирования МФТИ) Дмитрий Юдин (Центр когнитивного моделирования МФТИ)

3_Scene graph loc Final.pdf

ml_Timophey_Kondrashov.pdf

SegBoQ model code

SegBoQ recall code

Отчетная конференция научного трека инновационного практикума ФПМИ 2025

Кирилл Иванов

Локализация по графу сцены

Клуб Выпусников

Speaker

Description

Primary author

Co-authors

Presentation materials