Мы — команда GigaChat Data, готовим данные для обучения базовых моделей GigaChat во всех модальностях (Text, Vision, Audio): SFT, RLHF, использование навыков, безопасность модели и пр. Кроме подготовки базовой модели, мы реализуем продуктовые решения на основе базовой модели.
Направления задач:
- Звуковая модальность GigaChat — большой языковой модели для генерации текста и ответов на вопросы на основе текста и аудио.
- ASR — распознавание речи, Automatic Speech Recognition. Краеугольная задача нашего отдела — сделать качественный, быстрый и стабильный ASR.
- Keyword Spotting (Wake-word detection) — важный компонент речевых технологий, через который проходит любое взаимодействие пользователя с устройством. Цель алгоритма Keyword Spotting — выявить ключевое слово в условиях шума и не допустить ложных активаций.
Обязанности
- Подготовка данных для обучения и тестирования моделей.
- Поиск точек роста, узких мест, нахождение путей улучшения качества моделей за счет данных.
- Предобработка, фильтрация и сегментация данных.
- Выстраивание архитектуры и написание пайплайнов разметки/сбора данных.
- Подбор online- и offline-метрик, анализ конечного продукта.
Требования
- Опыт работы на Python на высоком уровне (алгоритмы, структуры данных, GIL, async).
- Опыт работы над улучшением качества моделей, базовое знание статистики.
- Инструментальное владение AI для анализа, генерации и автоматизации.
Будет преимуществом
- Обучение в ШАД.
- Опыт с краудсорсингом.
- Опыт работы с моделями распознавания речи/LLM.
Условия
- Комфортный современный офис — м. Кутузовская.
- Ежегодный пересмотр зарплаты, годовой бонус.
- Корпоративный спортзал и зоны отдыха.
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития.
- Расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа.
- Гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ.
- Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.
- Вознаграждение за рекомендацию друзей в команду Сбера.
- Корпоративная пенсионная программа.