📍 Санкт-Петербург (м. Балтийская)Офис или гибрид
Специализация
Data Science / Machine Learning
Технологии/инструменты
Python/Java/C++
Наша команда разрабатывает инструменты, необходимые специалистам по Data Science для обучения нейросетевых моделей на десятках терабайтов данных и сотнях GPU, а также для контролируемой эксплуатации этих моделей в облаке и в контуре клиента. Например, нашей платформой пользуется сервис Yandex SpeechKit, который обеспечивает облачный синтез и распознавание голоса.
Чем предстоит заниматься
- Разрабатывать инструменты для лёгкого обучения современных нейросетевых моделей на мощностях суперкомпьютеров Яндекса (и Yandex Cloud).
- Создавать сервис для эффективного инференса моделей машинного обучения (в том числе применение таких моделей, как BERT и GPT-3) на GPU и на CPU в облаке.
- Развивать инструменты для автоматического переноса инференса из облака в инфраструктуру клиента — как в закрытую инфраструктуру, так и для применения на различных девайсах, например мобильных телефонах.
- Заниматься исследованиями инструментов для инференса и обучения нейросетевых моделей с низкой точностью (int8, NVIDIA Ampere Structured Sparsity) и доводить их до продакшена.
- Участвовать в развитии облачной платформы MLOps.
Ожидания
- Знаете Java, Python или C++ и готовы использовать тот из языков, который наиболее эффективно будет решать конкретные задачи.
- Знакомы с различными источниками данных: KV-хранилищами, реляционными БД, файловыми системами.
Будет плюсом:
- Имеете представление об устройстве современного железа и использовании его для высокопроизводительных вычислений (High Performance Computing).
- Работали с фреймворками для машинного обучения (PyTorch, TensorFlow).
- Программировали под GPU (OpenCL, CUDA).
- Знакомы с фреймворками и технологиями для инференса нейросетевых моделей (TensorRT, OpenVINO, Triton и др.).
Августина Барабанова IT Recruiter