Вакансия в архиве
Компания больше не ищет сотрудника. Посмотрите похожие предложения

Разработчик С++ (Инференс нейросетей)

в Т-Банк

от 300 000 ₽/мес до налогов, совокупно

📍 Москва (м. Белорусская)Санкт-Петербург (м. Площадь Александра Невского)ВоронежКазаньЕкатеринбургСамараКраснодарНижний НовгородМожно удалённо из РФ

Специализация

С / С++

Уровень

Senior

Технологии/инструменты

С/С++PythonGoCUDA*nix

Развиваем эффективный инференс LLM-моделей и формируем команду, которая займется развитием решения для сервинга больших языковых моделей. В этом году мы планируем запуск большого числа продуктов на основе LLM. Наши пользователи — более 40 миллионов клиентов Т-Банка.

Основной технический вызов — научиться выжимать максимум в генерации токенов в секунду с одной GPU при должном уровне качества. И делать это максимально эффективно с точки зрения потребления вычислительных ресурсов.

Вам и команде предстоит оптимизировать распределенный инференс и решать инфровые проблемы — такие как скорость обновления моделей на продакшене, размер которых может достигать сотен гигабайт.

Ищем специалиста, который готов стать экспертом в инференсе LLM-моделей. Вы будете искать практики ускорения, оценивать их применимость и реализовывать новые подходы в сервинге.

Что нужно делать

Проектировать и разрабатывать сервинг для LLM-моделей.
Плотно работать с ML-инженерами при внедрении SOTA-моделей и оптимизации инференса.
Искать, оценивать и внедрять лучшие практики с развивающегося в этом направлении рынка.
Заниматься исследовательской разработкой: от paper до релиза в продакшен.
Вникать в архитектуру нейросетей, которые выбирают ML-специалисты.
Взаимодействовать с инфраструктурными командами.

Примеры задач, в которых предстоит разбираться:

Будет много интересных задач и челленджей: RPS, требования по отказоустойчивости и производительности. У нас вы сможете научиться реализовывать все нужные подходы в собственном решении и придумывать свои.

Ожидания

Хорошее знание С/С++.
Есть опыт разработки на Python, готовы попробовать Go.
Есть навыки параллельной и многопоточной разработки на CUDA.
Есть опыт разработки бэкендов под *nix.

Будет плюсом:

Опыт написания Extensions к Triton Inference Server.

Мы предлагаем

Работу в офисе или удаленно — по договоренности.
Платформу обучения и развития «Т-Банк Апгрейд». Курсы, тренинги, вебинары и базы знаний. Поддержку менторов и наставников, помощь в поиске точек роста и карьерном развитии.
Комплексную программу заботы о здоровье. Оформим полис ДМС с широким покрытием и страховку от несчастных случаев. Предложим льготные условия страхования для ваших близких.
Возможность работы в аккредитованной ИТ-компании.
Линейку льготных тарифов на продукты Т-Банка.
Частичную компенсацию затрат на спорт.
Well-being-программу, которая помогает улучшить психологическое и физическое здоровье, а также разобраться с юридическими и финансовыми вопросами.
Три дополнительных дня отпуска в год.
Достойную зарплату — обсудим ее на собеседовании.

Дарья Шаповал IT HR

О компании Т-Банк

Сфера

Банки / Финтех

Инвестиции

$100M+

Размер

1001+

Т-Банк — онлайн-экосистема, основанная на финансовых и лайфстайл-услугах. Клиентами Т‑Банка стали 50 млн человек по всей России.

Ещё 57 похожих вакансий

Больше вакансий

Senior C++ разработчиков C++ разработчиков в России Lead C++ разработчиков в регионах РФ C++ разработчиков в Санкт-Петербурге Senior C++ разработчиков в Москве Lead C++ разработчиков с релокацией

Зарплаты

C++ разработчиков C++ разработчиков

Разработчик С++ (Инференс нейросетей)

в Т-Банк

от 300 000 ₽/мес до налогов, совокупно

Технологии/инструменты

Что нужно делать

Ожидания

Мы предлагаем

О компании Т-Банк

Похожие вакансии

Руководитель группы разработчиков бэкенда (Arc)

Тимлид разработки (Kоммуникации)

Team Lead C++ (Базы данных)

Старший разработчик (Инфраструктура рекомендательных систем)

Руководитель команды (Поиск)

Больше вакансий

Похожие вакансии

Зарплаты

Разработчик С++ (Инференс нейросетей)

в Т-Банк

от 300 000 ₽/мес до налогов, совокупно

Поделиться

Поделиться

Технологии/инструменты

Что нужно делать

Ожидания

Мы предлагаем

О компании Т-Банк

Похожие вакансии

Руководитель группы разработчиков бэкенда (Arc)

Тимлид разработки (Kоммуникации)

Team Lead C++ (Базы данных)

Старший разработчик (Инфраструктура рекомендательных систем)

Руководитель команды (Поиск)

Больше вакансий

Похожие вакансии

Зарплаты