Компания больше не ищет сотрудника. Посмотрите похожие предложения

Старший разработчик (Инференс нейросетей)
в Яндекс (Поисковый портал)
280 000 — 350 000 ₽/мес на руки
Технологии/инструменты
Наша группа развивает высокопроизводительную мультиплатформенную библиотеку для инференса нейросетей (YNMT), на которой работают YandexGPT, Алиса, Поиск и другие высоконагруженные сервисы Яндекса.
Мы интегрируем новые специфичные ML-оптимизации (квантизации весов и активаций, фьюзинг вычислений и т. д.) и упрощаем API для облегчения интеграции в новые сервисы — поддерживаем стандарт ONNX.
Ищем опытного разработчика на C++ для внедрения самых современных решений в инференс-нейросетей.
Что нужно делать
- Реализовывать новые подходы и архитектуры для инференса больших языковых моделей (например, GPT-Q, GQA).
- Отлаживать, профилировать и оптимизировать имеющиеся примитивы.
- Запускать инференс на новых платформах (ускорители AMD и не только), оптимизировать под ARM, в будущем — под NPU.
Мы ждём, что вы
- Имеете опыт работы от 5 лет.
- Занимались низкоуровневой оптимизацией сложных вычислений: математическими библиотеками, инференсом, нагруженными системами.
- Умеете профилировать код, понимаете возможные пути его оптимизации.
- Отлично знаете C++, можете написать вспомогательный скрипт на Python.
- Работали с x86, ARM, CUDA или другими архитектурами.
Полезные ссылки
- Как мы нанимаем бэкенд-разработчиков: ссылка.


О компании Яндекс (Поисковый портал)
Яндекс — одна из крупнейших ИТ-компаний в России. Мы развиваем самую популярную в стране поисковую систему и создаём сервисы, которые помогают людям в повседневных делах. С их помощью можно искать информацию в интернете, слушать музыку, выбирать товары и места, заказывать еду, перемещаться по городу и делать многое другое. Яндекс предлагает также продукты для бизнеса.