Сбер

Data Infrastructure & Platform Tech Lead (GigaChat)

в Сбер

700 000 —‍ 1 200 000 ₽/‍мес до налогов

📍 Москва (м. Кутузовская)
Гибрид
Специализация
Data Scientist & Machine Learning / Data Engineering
Уровень
Lead
Английский
C1/C2 — Advanced / Fluent
Требуемый опыт
6+ лет

Технологии/инструменты

C++
Rust
Python
Kubernetes
Iac
Ytsaurus

За каждым запуском обучения модели стоит масштабная инфраструктура данных, которая должна хранить, обслуживать, версионировать и оркестрировать петабайты данных с высокой пропускной способностью и высокой надёжностью. Команда платформы данных создаёт базовую технологическую основу, на которую опираются все остальные команды, работающие с данными.

В этой роли вы будете отвечать за техническое развитие платформы хранения, вычислений и оркестрации, лежащей в основе полного жизненного цикла данных для претрейнинга. Это техлидская позиция для сильного инженера, который способен проектировать платформенные решения, задавать стандарты для команды, развивать инженерную культуру и помогать коллегам расти.

Роль предполагает высокий уровень технического влияния и может стать естественным шагом к переходу в тимлидскую позицию по мере роста команды.

Чем предстоит заниматься

  • Проектировать и развивать масштабные системы хранения данных, оптимизированные под характерные паттерны доступа в претрейне LLM.
  • Развивать платформу версионирования и отслеживания происхождения данных, обеспечивающую воспроизводимость и аудит на всём жизненном цикле датасетов.
  • Создавать и совершенствовать системы оркестрации workflow-ов, координирующие многоэтапные пайплайны данных на тысячах узлов.
  • Оптимизировать инфраструктуру подачи данных так, чтобы обучающие данные поступали на GPU-кластеры без узких мест и с минимальными потерями вычислительного времени.
  • Развивать внутренние инструменты, SDK и API, которые упрощают работу исследователей и дата-инженеров с платформой данных.
  • Реализовывать механизмы контроля доступа, шифрования и audit logging для работы с чувствительными и лицензированными датасетами.
  • Отвечать за capacity planning, оптимизацию затрат и performance benchmarking для облачной и локальной инфраструктуры хранения.
  • Формировать технические стандарты платформенной команды: архитектурные подходы, требования к надёжности, эксплуатационные практики, code review и инженерную документацию.
  • Менторить инженеров, помогать команде расти технически и распространять экспертизу по платформенной архитектуре и надёжной эксплуатации систем.

Мы ожидаем

  • Высшее образование в области computer science, systems engineering или смежной области.
  • Не менее 6 лет опыта в infrastructure engineering или platform engineering, включая серьёзный опыт построения data-intensive distributed systems.
  • Экспертное знание облачной инфраструктуры, объектного хранения, оркестрации вычислений и сетевых подсистем.
  • Уверенное владение как минимум двумя языками из следующих: Python, Rust, C++.
  • Глубокий опыт работы с Kubernetes, Infrastructure as Code и CI/CD-пайплайнами.
  • Подтверждённый опыт проектирования систем с высокой доступностью, отказоустойчивостью и горизонтальной масштабируемостью.
  • Опыт работы с промышленными форматами хранения и сериализации данных и понимание их эксплуатационных компромиссов.
  • Способность выступать техническим лидером команды: принимать архитектурные решения, согласовывать платформенные подходы между командами и системно развивать коллег.
  • Опыт менторинга и построения сильных инженерных практик внутри команды.

Будет плюсом

  • Опыт работы с YTSaurus.
  • Опыт поддержки ML training workloads, особенно претрейна на крупных GPU-кластерах.
  • Знакомство с инструментами orchestration для data-пайплайнов в промышленном масштабе.
  • Опыт создания внутренних платформ разработки и self-service-инструментов для инженерных команд.

Что предлагаем

  • Кластеры YTSaurus с большим количеством ресурсов: десятки петабайт + десятки тысяч ядер.
  • Сильная команда выпускников МФТИ, ВШЭ, МГУ, много людей с опытом работы в профильном БигТехе.
  • Комфортный современный офис рядом с м. Кутузовская.
  • Гибридный формат работы (2 дня в офисе, 3 дня на удалёнке).
  • Ежегодный пересмотр зарплаты, годовая премия.
  • Корпоративный спортзал и зоны отдыха.
  • Система обучения для профессионального и карьерного развития.
  • Расширенный полис ДМС с первого дня работы и страхование для семьи.
  • Льготная программа ипотеки для сотрудников.
  • Бесплатная подписка СберПрайм+, скидки на продукты компаний-партнёров.
  • Вознаграждение за рекомендацию друзей в команду Сбера.
Сбер

О компании Сбер

Сфера
Банки / Финтех
Размер
1001+

Сбербанк — крупнейший банк в России, Центральной и Восточной Европе, один из ведущих международных финансовых институтов. Самый дорогой российский бренд и самый сильный банковский бренд в мире по версии Brand Finance.