Сбер

Senior Deep Learning Engineer (Speech LLM)

в Сбер

от 500 000 ₽/‍мес до налогов

📍 Москва
Офис
Специализация
Data Scientist & Machine Learning
Уровень
Senior
Требуемый опыт
3+ лет

Технологии/инструменты

deep learning
machine learning
python
pytorch
reinforcement learning

О проекте

Мы ищем сильного Deep-Learning-инженера в команду, создающую ASR-системы нового поколения на пересечении технологий распознавания речи и audio-native LLM.

Один из наших главных вызовов сейчас — разработка Next Gen LLM-based ASR. Это инструктивная система, которая выходит далеко за рамки обычного speech-to-text: она будет поддерживать выдачу временных меток, диаризацию спикеров, тегирование звуковых событий и keyword prompting. База для быстрого старта уже готова: у нас есть мощный Foundation Encoder (GigaAM) и сильная диалоговая модель (GigaChat Audio).

Первый этап отбора на эту вакансию — общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

Обязанности

  • LLM-based & Next Gen ASR: обучение больших Audio-conditioned LLM. Расширение возможностей ASR за пределы простого транскрибирования: добавление инструктивности, временных меток, диаризации, тегов событий и keyword prompting.
  • SFT & Online RL: проведение масштабных ML-экспериментов с Supervised Fine-Tuning и методами Online Reinforcement Learning для выравнивания модели и улучшения качества распознавания.
  • Ecosystem Impact & Multimodal: использование обученной LLM-based ASR для автоматической разметки и создания высококачественных датасетов. Эти данные пойдут на улучшение текущих ASR- и TTS-моделей, а также станут базой для multimodal audio-native pre-training.
  • Knowledge Distillation: дистилляция знаний из тяжелых LLM в быстрые и легкие модели (ASR, text normalization) для некоторых production-сценариев.
  • Research & Engineering: анализ актуальных научных статей, быстрая проверка гипотез на практике и доведение успешных экспериментов до прода.

Требования

  • Уверенное владение Python и PyTorch: написание чистого модульного кода, ООП, типизация, тесты.
  • Distributed Training: уверенный практический опыт распределенного обучения больших моделей, понимание принципов работы под капотом (DDP, FSDP, Tensor Parallelism, Context Parallelism).
  • LLM Training: понимание современных пайплайнов обучения LLM (Pre-training, SFT, DPO, Online RL) и архитектур (DeepSeek3.2, Qwen3.5).
  • Research mindset: умение читать статьи, быстро перекладывать исследовательские идеи в работающий код и грамотно ставить эксперименты.
  • Опыт работы с аудио и/или мультимодальными LLM будет большим плюсом.

Условия

  • Крупнейшее DS&AI community — более 600 DS-специалистов банка.
  • Дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира.
  • Возможность быть соавтором НИРов и статей для международных конференций.
  • Возможность выбрать удобный формат работы: гибрид или офис.
  • Ежегодный пересмотр зарплаты, годовая премия.
  • Корпоративный спортзал и зоны отдыха.
  • Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития.
  • Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа.
  • Ипотека выгоднее до 7% для каждого сотрудника.
  • Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.
  • Вознаграждение за рекомендацию друзей в команду Сбера.
Сбер

О компании Сбер

Сфера
Банки / Финтех
Размер
1001+

Сбербанк — крупнейший банк в России, Центральной и Восточной Европе, один из ведущих международных финансовых институтов. Самый дорогой российский бренд и самый сильный банковский бренд в мире по версии Brand Finance.