📍 Москва (м. Бауманская)Полная удалёнка
В новый проект М.Видео нужен SRE, который построит инфраструктуру с нуля с подходом IaC и спустя несколько месяцев возглавит команду 3-4 SRE-инженеров.
Рядом работают несколько сильных инфраструктурных команд. Это значит, что всегда найдется с кем посоветоваться. Также, решения можно валидировать на регулярных архитектурных комитетах.
Технологии/инструменты
KubernetesPrometheusLokiGrafanaJaegerTerraformHelmPostgreSQLMongoDBKafka
Чем предстоит заниматься
В проектах нет legacy, вся разработка ведётся на современном стэке.
Уже есть команда дежурных инженеров L2 с присутствием 24x7 — наши глаза и руки, которые в случае проблем прода, требующих вызова on-call SRE, уже смогут дать контекст к моменту нашего подключения;
- Писать инфраструктуру как код: Terraform + Helm, YaC + AWS.
- Управлять error budget, выстраивая адекватные SLO / SLI.
- Участвовать в развитии системы сквозного трейсинга (Jaeger).
- Настраивать получение и агрегацию метрик от всех слоёв приложений, начиная от браузера и заканчивая низкоуровневыми инфраструктурными компонентами (Prometheus, Loki, Grafana, Jaeger).
- Быть частью продуктовых команд, находиться рядом с продуктами и фичами от момента их планирования и дизайна, до разработки, тестирования, вывода в прод и обновления.
Кого ищем
- Опыт развёртывания и сопровождения микросервисных, высоконагруженных, отказоустойчивых приложений.
- Kubernetes — опыт развёртывания и эксплуатации, как в on-prem, так и в managed вариантах (облака AWS / YaC).
- Опыт SRE / DevOps.
- Хороший опыт работы со следующими инструментами (необязательно со всеми!): Prometheus, Grafana, ELK, Jaeger, Loki, Zabbix, AppDynamics, Nginx, OpenResty, HAProxy, Istio, keepalived, PostgreSQL, ElasticSearch, Redis, Couchbase, MongoDB, Kafka, Git, Gitlab CI, Jira, Confluence, Ansible, Terraform, Thanos, VictoriaMetrics, Helm, Harbor, SonarQube, Hashicorp Vault (почти всё из этого у нас так или иначе используется).
- Практики observability.
- Знания сетевых протоколов, понимание маршрутизации и фильтрации трафика.
Будет плюсом:
- Kafka.
- Опыт настройки и эксплуатации L4/L7 балансировщиков под высоконагруженные задачи.
- Понимание и опыт построения высоконагруженных распределённых систем.
- Опыт построения Multicloud распределенных систем.
- Service mesh (Istio).
- Настройка автоскейлинга stateful сервисов.
- Опыт локализации проблем в больших и сложных системах.
Что предлагаем
- Удаленная работа.
- Сильная команда, нацеленная на результат.
- Конкурентоспособная зарплата.
- Система гибких льгот (ДМС, страхование жизни и др.).
- Развитая корпоративная культура.
- Возможность работать в офисе по желанию — 10 минут пешком от м. Бауманская / м. Красносельская.
- Корпоративные скидки на продукцию компании.
Анна Ситникова Tech Recruiter