📍 МоскваСамостоятельный переезд
Специализация
Data Science
Команда аналитики генеративных моделей на стыке NLP и компьютерного зрения занимается улучшением качества базовой модели, которая создаёт изображения по текстовому описанию. Эта технология лежит в основе Шедеврума и других продуктов Яндекса.
Наши цели: значительно улучшить качество за счёт модификации пайплайна сбора данных; разработать инструменты для сравнения с другими моделями; выделять полезный пользовательский сигнал и использовать его для улучшения модели. Ищем талантливых специалистов в области аналитики, готовых присоединиться к нашей команде.
Технологии/инструменты
PythonSQL
Что нужно делать
- Сравнивать разные версии датасетов по их разнообразию, полноте и качеству.
- Выделять классы запросов, на которых модель плохо работает, и искать способы её улучшения.
- Реализовывать разметки с помощью краудсорсинговых платформ, улучшать их качество и скорость.
- Анализировать взаимодействие пользователя с продуктом и выделять полезный для обучения сигнал, в том числе для метода RLHF.
Мы ждем, что вы
- Занимались аналитикой или Data Science не меньше года.
- Уверенно пишете на Python и SQL, знаете основные библиотеки для Data Science.
- Знаете основы машинного обучения.
- Умеете применять статистику для анализа данных и интерпретации результатов.
Будет плюсом, если вы:
- Знакомы с инструментами и библиотеками обработки изображений: Pillow, OpenCV, HuggingFace, PyTorch.
- Участвовали в соревнованиях на Kaggle.
- Работали с продуктами из области компьютерного зрения.
- Использовали модели компьютерного зрения: ResNet, CLIP, ViT.
Условия
- Сильная команда, с которой можно расти.
- Сложные задачи для сервисов с миллионами пользователей.
- Возможность влиять на процесс и результат.
- Зарплата на уровне рынка и выше.
- Премии каждые полгода для всех, кто успешно прошёл ревью.
- Расширенная программа ДМС, оплата 80% стоимости ДМС для супругов и детей.
- Гибкий график работы.
Арина Шмеркович IT Recruiter