Всем привет!
Мы — HR Prime, кадровое агентство, которое занимается подбором для топовых компаний в России.
Наш клиент — финтех-компания, создающая классные продукты.
Мы ищем Senior SRE Engineer, который станет первым специалистом по надёжности систем в команде и сыграет ключевую роль в формировании SRE-культуры в компании.
Вы будете единственным SRE на старте, но с возможностью вырастить направление и в будущем заниматься наставничеством.
Чем предстоит заниматься
- Формировать и внедрять SRE-стратегию с нуля: от определения SLI/SLO до автоматизации реакций на инциденты.
- Тесно взаимодействовать с разработчиками, повышая их SRE-грамотность и встраивая надёжность в CI/CD-процессы.
- Развивать систему мониторинга и Observability на стеке VictoriaMetrics, Loki, Tempo и OpenTelemetry.
- Участвовать в проектировании отказоустойчивой инфраструктуры в облаке.
- Оптимизировать и развивать CI/CD на базе GitLab CI и ArgoCD.
- Постепенно выстраивать on-call-процессы и культуру управления инцидентами.
Мы ожидаем, что вы
- Имеете опыт работы SRE/DevOps на уровне Senior (5+ лет в инфраструктуре/надёжности).
- Уверенно владеете Observability-стеком (желательно — VictoriaMetrics, Loki, Tempo, OpenTelemetry).
- Понимаете принципы построения SLO/SLI и умеете внедрять их в продуктовые процессы.
- Опытны в работе с облачными средами и GitOps-подходами.
- Обладаете сильными soft skills: умеете выстраивать доверие, доносить инженерные идеи и обучать коллег.
Будет плюсом
- Опыт запуска SRE-практик «с нуля» в растущих командах.
- Понимание особенностей MLOps-инфраструктур.
Из плюшек
- ТК РФ.
- Гибридный график в Москве, 3/2.
- ДМС со стоматологией.
- Постоянное обучение.
- Разнообразная корпоративная жизнь.