📍 Москва (м. Шаболовская)Можно удалённо из РФ
Английский
B2 — Upper-IntermediateB2 — Upper-Intermediate
Миссия команды Observability — обеспечить наблюдаемость и прозрачность работы всех приложений и процессов компании, предоставляя командам оптимальные инструменты и экспертизу.
Команда работает в 3 направлениях: инженерное, аналитически-процессное и прикладное, которое покрывает работу над инструментами для команд разработки (Slack, Jira и т.п.).
Технологии/инструменты
LinuxCentOSUbuntuHTTPTCP/IPDNSREST APIKubernetesHelmBash/Python/Go/Groovy
- Frontend: React, TypeScript, React Native, Flow, Vue.
- Backend: Java, Kotlin, Node.js, Go, Python.
- Android: Kotlin, Compose, Kotlin Multiplatform.
- iOS: Swift, SwiftUI, Kotlin Multiplatform.
- Data Engineering: Kafka, NiFi, S3, Spark, Greenplum, ClickHouse, Airflow.
- Data Transport: Debezium, Kafka, NiFi, S3, Greenplum.
- ML: Catboost, LightGBM, TensorFlow, OpenCV, DVC, MLFlow.
- DevOps: Docker, Kubernetes, Jenkins, Artifactory, Ansible, Helm, Prometheus, ELK.
Тебе предстоит
- Помогать продуктовым командам развивать мониторинг, внедрять методики обеспечения надежности и применять прочие SRE практики.
- Участвовать в построении общекорпоративной экосистемы мониторинга, алертинга, хранения метрик и визуализации (разработка и предоставление инструментов "как сервис").
- Обеспечивать бесперебойную работу сервисов и поддержку инфраструктуры команды.
- Управлять конфигурацией, автоматизацией развертывания и обновления сервисов и прочие рутинные операции (configuration management, Infrastructure as Code).
Ожидания
- Понимание принципов работы систем мониторинга и алертинга, метрик и time series, построения графиков и т.д.
- Понимание практик SRE, в том числе критерии доступности — SLO, SLI, SLA.
- Опыт администрирования Linux (CentOS, Ubuntu), баз данных и работы с сетевым стеком (HTTP, TCP/IP, DNS, REST API).
- Опыт работы с системами виртуализации и контейнеризации.
- Опыт работы с Kubernetes, организации его мониторинга и владение Helm.
- Владение любым языком: Bash, Python, Go, Groovy и т.д.
- Уверенное владение английским языком (мы плотно взаимодействуем с зарубежными коллегами).
Приветствуются:
- Понимание паттернов обеспечения отказоустойчивости — load balancing, circuit breakers, disaster recovery.
- Опыт работы с Яндекс.Облаком и Terraform.
- Опыт построения long-term хранилища метрик на базе VictoriaMetrics / Thanos / Cortex / Grafana Mimir будет большим плюсом.
- Опыт внедрения трассировки (tracing) на базе OpenTelemetry будет большим плюсом.
- Опыт построения HA реализаций мониторинга на базе Prometheus stack.
- Умение работать с Git, Ansible / Salt, JSON, YAML и опыт написания CI/CD пайплайнов.
- Понимание методологии DevOps и опыт взаимодействия с Agile командами разработки.
Условия
- Прозрачные условия для профессионального и карьерного роста: наши сотрудники имеют все возможности для горизонтального и вертикального перехода.
- Ежемесячная (5%) и ежеквартальные премии (до 25% от общего квартального дохода) + оклад.
- ДМС со стоматологией от Ренессанс, телемедицина.
- Страхование от несчастных случаев.
- Ежемесячно выплачивается дотация на питание.
- Участие в конференциях и во внутренних, и внешних митапах.
- Гибкий график и возможность работать удалённо.
- Английский и французский язык для изучения по согласованию.
- Корпоративные скидки.
Елена Бейманова IT Recruiter