Отчетная конференция научного трека инновационного практикума ФПМИ 2025

Name: Отчетная конференция научного трека инновационного практикума ФПМИ 2025
Start: 2025-05-17T12:30:00+03:00
End: 2025-05-20T20:00:00+03:00
Location: МФТИ

17–20 May 2025

МФТИ

Europe/Moscow timezone

Кирилл Иванов

ivanov.km@mipt.ru

Улучшение Fine Tuning LLM c помощью Multi Token Prediction

18 May 2025, 15:30

12m

Клуб Выпусников

ТЦ Дирижабль, ул. Первомайская 3а

Машинное обучение и нейросети 18-Машинное обучение и нейросети

Egor Mostovykh (MIPT)

Abstract:

Мы расширяем результат статьи Gloeckle (2024), заключающийся в том, что LLM обученная с несколькими дополнительными головами (используя метод multi token prediction) получается лучшего качества. В нашей работе мы показываем, что используя multi token prediction, можно улучшить также качество Fine Tuning-а моделей. Также в данной работе улучшения появляются начиная с размера моделей 1B, в том время как в оригинале - начиная с 7B.

Egor Mostovykh (MIPT)

Mr Кирилл Богданов (МФТИ)

1_MTP_presentation (4).pdf

ml_Egor_Mostovykh.docx

Отчетная конференция научного трека инновационного практикума ФПМИ 2025

Кирилл Иванов

Улучшение Fine Tuning LLM c помощью Multi Token Prediction

Клуб Выпусников

Speaker

Description

Primary author

Co-author

Presentation materials