Привет! На связи Купер.тех!
Купер (ex СберМаркет) — это сервис доставки из магазинов и ресторанов. За 10 лет сервис вырос из foodtech-стартапа в высокотехнологичную компанию.
Купер — это профессиональная команда и надёжная IT-инфраструктура, которая увеличилась в 77 раз с 2019 года. Купер объединяет свыше 1 300+ IT-специалистов. Мы создаем вдохновляющий продукт для миллионов клиентов.
Cейчас мы находимся в поиске DevOps-инженера в группу систем мониторинга (Observability).
Технологии/инструменты
Bash/Python/Ruby/GolangAnsibleDockerKubernetesHelmNginx/HaproxyVictoriaMetrics/GrafanaPromQLOpenTelemetryTerraform
Почему мы
- Наша команда DevOps — это 50+ инженеров (и мы продолжаем расширяться).
- Нагрузка на наш сервис перевалила за 310 000 rpm.
- Рост нагрузки x2 каждый год.
- Мы собираем более 3Тб логов в день.
- Число подов в 1 кластере k8s перевалило за 10 000.
- Мы используем open source продукты.
Чем предстоит заниматься
- Разрабатывать и поддерживать инфраструктуры мониторинга и логирования, включая сбор, хранение и анализ метрик, журналов и трейсов.
- Автоматизировать процессы мониторинга и управления инфраструктурой, чтобы обеспечить максимальную отказоустойчивость и производительность системы.
- Разрабатывать и поддерживать инструменты для анализа и визуализации данных, чтобы облегчить процесс принятия решений и улучшить опыт пользователей.
- Участвовать в проектировании новых систем и функциональности с учетом требований к мониторингу и логированию.
- Сотрудничать с другими командами в компании для обеспечения интеграции мониторинга и логирования в различные приложения и сервисы.
- Исследовать новые технологий и тенденций в области мониторинга и логирования с целью улучшения производительности и сокращения времени реакции на проблемы в системе.
Мы рассчитываем, что ты
- Имеешь опыт работы: 3–6 лет.
- Эксперт в k8s как по части control plane, так и по части эксплуатации приложений в k8s.
- Знаешь один из скриптовых языков (Bash, Python, Ruby, etc.), предпочтительно Golang.
- Работал с Terraform и в целом с системами управления конфигурациями (Ansible).
- Ранее работал с контейнерами и оркестрацией (Docker, Docker-Compose, Kubernetes, Helm).
- Знаком с основными балансировщиками — Nginx/Haproxy.
- Понимаешь принципы и имеешь опыт построения отказоустойчивых сервисов/эксплуатации высоконагруженных систем (Web-серверов, реляционных БД, серверов приложений).
- Имеешь навыки построения мониторинга и траблшутинга, как системных, так и прикладных компонентов: какие метрики собирать, куда смотреть при проблемах, какие дашборды для этого нужны (мы используем VictoriaMetrics/Grafana).
- Знаешь все о SLO/SLI/SLA.
- Отлично знаком с PromQL.
- Знаком с OpenTelemetry.
- Знаешь, зачем нужны APM.
- Строил высоконагруженные кластера метрик, логов, трейсов.
- Жить не можешь без Grafana.
- Отлично разбираешься в процессах Инцидент-менеджмента, процесса построения мониторинга в условиях микросервисной архитектуры.
- Любишь писать документацию.
Будет плюсом
- Если писал модули под публичные облака.
Что интересного у нас есть
- ДМС.
- Предоставляем множество корпоративных бонусных программ.
- Работаем удаленно. В Москве есть большой и красивый офис — welcome.
- Выдаем технику для работы на твой выбор.
- Помогаем интеллектуально и физически развиваться (электронная библиотека, книжный клуб, футбол).
- Уделяем большое внимание обучению сотрудников, поэтому в нашей knowledge base ты найдёшь много интересных курсов, книг и записей конференций, а также у нас есть выделенный бюджет на образование.
А ещё
- Мы сами участвуем в конференциях как спикеры.
- Проводим внутренние митапы.
- Не боимся экспериментировать с новыми решениями и технологиями.
Дарья Лагодюк IT Recruiter